天大地大 发表于 2010-12-11 09:17:24

2010SP2版本对带中文的网址,采集得到乱码

在百度搜索“手机 138”,网址有以下两种表达方式(这两种方式的搜索结果是完全一样的):
①http://www.baidu.com/s?wd=手机+138
②http://www.baidu.com/s?wd=%CA%D6%BB%FA+138

用2010SP2免费版时,发现对网址中出现汉字的情况,无法正常采集。采集得到的中文内容,都是乱码。也就是说,用网址形式①采集到的不正常,用网址形式②采集到的才正常。以前的20080808老版本,对这两种网址表达方式,采集结果都是一样正常的。

是程序的问题,还是小菜我的问题?高手指点为谢~~~

附任务规则【2010SP2免费版规则】

xyunhua 发表于 2010-12-14 16:41:40

我也是乱码,没人回答?

gapo83 发表于 2011-3-16 21:13:01

我采集的一个站点中文地址保存到pageurl时,变成乱码。

woyaojipin 发表于 2011-3-17 04:45:25

这个我开始没什么注意.后来发现有时候会采到很多乱码标题的

伦理片伦理片伦理电影伦理电影第四色第四色蝴蝶谷蝴蝶谷开心播播开心播播
黄色网站黄色网站黄色黄色黄色网黄色网美国十次啦美国十次啦人体艺术人体艺术
美国十次美国十次一个色一个色导航导航四房播播四房播播日本人体艺术日本人体艺术一个色
五月天导航五月天导航农夫电影色即是空色戒

jackwebsite 发表于 2011-3-19 08:10:15

加我QQ,免费教你

天大地大 发表于 2011-4-19 21:59:25

本帖最后由 天大地大 于 2011-4-19 22:03 编辑

加我QQ,免费教你
jackwebsite 发表于 2011-3-19 08:10 http://bbs.locoy.com/images/common/back.gif

既然您扬言“免费”,又何必绕道QQ?在帖子里展现一下更方便吧,况且还可以让更多的车友受益。
衷心赐教的大虾,真是万分感激的!但是抱有其他目的遮遮掩掩的,就算了吧。

解决的办法:系统全局设置里 修改那个编码为采集时的编码,就能解决了
页: [1]
查看完整版本: 2010SP2版本对带中文的网址,采集得到乱码