不能采集中文网址的页面内容
今天发现带有中文网址的网站采集不了,在页面测试的时候读取到的源码不完整,标题是乱码。 我也有这样的问题.谁解决了告诉一下 用工具将中文部分作一次编码,然后再访问,就可以了。 原帖由 dr5d 于 2006-7-19 23:49 发表用工具将中文部分作一次编码,然后再访问,就可以了。
老兄,这个我当然知道了,根本不用工具,你直接用百度搜索,网址里就包含你搜索的关键字的编码。但是你想下,你可能对所有的网址进行编码?采集的网站里面的所有网址都是带中文的,如果一个个编码我还用采集吗?直接手工拷贝得了:o 呵呵,只要在火车里要火车头加个编码选择工具就可以了,这不是什么很难的问题/
废话一句:如果我会的话,我肯定会加的! 就是 原帖由 insun 于 2006-7-24 05:29 发表
老兄,这个我当然知道了,根本不用工具,你直接用百度搜索,网址里就包含你搜索的关键字的编码。但是你想下,你可能对所有的网址进行编码?采集的网站里面的所有网址都是带中文的,如果一个个编码我还用采集 ...
还没遇到内容页面地址是中文的 此问题火车VIP版已解决 恩:) 哪位有实现的方法?
页:
[1]