【已解决】2010SP2免费版对出现汉字的网址无法正常采集!
本帖最后由 天大地大 于 2010-12-15 09:19 编辑更新:非常不好意思,经过摸索学习,这不是bug。系统全局设置里 修改那个编码为采集时的编码,就能解决了
采集百度搜索关键词“手机 138”时,发现了bug,反馈如下:
在百度搜索“手机 138”,网址有以下两种表达方式(这两种方式的搜索结果是完全一样的):
①http://www.baidu.com/s?wd=手机+138
②http://www.baidu.com/s?wd=%CA%D6%BB%FA+138
以前的20080808老版本,对这两种网址表达方式,采集结果都是一样正常的。但是这次尝试用2010SP2免费版时,发现对网址中出现汉字的情况,无法正常采集。采集得到的中文内容,都是乱码。也就是说,用网址形式①采集到的不正常,用网址形式②采集到的才正常。
附任务规则【2010SP2免费版规则】
谢谢答案,我苦恼了几个小时,搜索到你的答案 谢谢答案,我苦恼了几个小时,搜索到你的答案
19book 发表于 2011-4-7 23:01 http://bbs.locoy.com/images/common/back.gif
呵呵,不客气
页:
[1]