caijihome 发表于 2013-9-28 21:20:20

关于编码,中文系统,乱码的问题,浏览器正常,采集器不正常。

测试网址 http://www.girlgames4u.com/mixed-nut-tart-game.html


用谷歌浏览器发现一切正常,火车头怎么调都不正常。




caijihome 发表于 2013-9-28 21:21:51

我觉得可能是中文系统问题,导致的,不兼容,但是谷歌怎么就兼容了,希望客服看看

caijihome 发表于 2013-9-28 21:25:52

这个测试是不是说明火车头调用浏览器还是有问题的。不然也不会错误了。

caijihome 发表于 2013-9-28 21:32:51

调用浏览器配置功能不完善,有问题。
功能不自动。2010版本可以,完全傻瓜式。V7的设置不但多,而且也不好使。
http://bbs.locoy.com/spider-131524-1-1.html

caijihome 发表于 2013-9-28 22:01:04

经测试,可能是火车头内置编码器问题

caijihome 发表于 2013-9-30 16:53:35

本帖最后由 caijihome 于 2013-9-30 17:53 编辑

http://class.ruten.com.tw/user/index00.php?s=itnken&p=1
测试网址

必须登录才能采集,而且极不稳定。

caijihome 发表于 2013-9-30 17:44:35

本帖最后由 caijihome 于 2013-9-30 17:54 编辑

有些网页每次请求源代码会变,太恶心人了。

topscan 发表于 2013-12-4 14:52:33

caijihome 发表于 2013-9-28 21:32 static/image/common/back.gif
调用浏览器配置功能不完善,有问题。
功能不自动。2010版本可以,完全傻瓜式。V7的设置不但多,而且也不好 ...

经过验证,v8属于蛋疼的版本,分页后的页面采集出来的中文网址居然是乱码。
幸好你提醒,果断换2010,结果蛋蛋从此不痛了!

290576138 发表于 2014-5-3 21:02:09

这个BUG没有给彻底解决。
http://www.teaspring.com/Ding-Gu-Da-Fang.asp采集这个网址的描述

kuhabe 发表于 2014-5-4 11:52:09

290576138 发表于 2014-5-3 21:02 static/image/common/back.gif
这个BUG没有给彻底解决。
http://www.teaspring.com/Ding-Gu-Da-Fang.asp采集这个网址的描述

您好,我这边测试了 正常 没有问题的,是不是你的编码没有选择好导致呢。
页: [1]
查看完整版本: 关于编码,中文系统,乱码的问题,浏览器正常,采集器不正常。