没吃饱的熊 发表于 2012-2-17 13:54:13

[已解决]**多玩网页采集,访问出错,请求帮助,感谢。

本帖最后由 没吃饱的熊 于 2012-2-17 18:58 编辑

http://db.duowan.com/wow/item-25.html

多玩魔兽数据库网页,需要采集标题。浏览器访问正常,但放到 火车采集器2010sp3 中测试,提示如下错误:

http://db.duowan.com/wow/item-25.html访问出错,出错代码:
错误信息:The server committed a protocol violation. Section=ResponseHeader Detail=CR must be followed by LF

类似网页,比如178的数据网页,测试和采集都没问题,例如:http://db.178.com/wow/cn/item/25.html

请求帮助,感谢。

caziyo 发表于 2012-2-17 14:23:57

【标题】:破损的短剑 - 物品 - NGA178魔兽世界数据库 - 国服4.3.0
【内容】:
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
        <title>破损的短剑 - 物品 - NGA178魔兽世界数据库 - 国服4.3.0</title>
        <meta http-equiv="X-UA-Compatible" content="IE=7" />
<meta name="keywords" content="NGA/178魔兽世界数据库,巫妖
测试没有问题    178和duowan这2个站的数据结构都是一样的 - -

没吃饱的熊 发表于 2012-2-17 14:25:37

本帖最后由 没吃饱的熊 于 2012-2-17 14:27 编辑

晕倒,楼上用的哪个火车版本呀?操作系统是什么呢?

我这里就是不行,郁闷死。

另外,你采集的内容是178的,不是多玩的啊。。。

caziyo 发表于 2012-2-17 16:32:14

在全局设置里----http设置----AllowUnsafeHeaderParsing勾选上

没吃饱的熊 发表于 2012-2-17 18:58:20

caziyo 发表于 2012-2-17 16:32 static/image/common/back.gif
在全局设置里----http设置----AllowUnsafeHeaderParsing勾选上

非常非常感谢,问题解决了!!!ali14ls

hangkongmuji 发表于 2012-3-3 23:28:35

http://wpa.qq.com/pa?p=2:972130397:47,为您解决采集难题
页: [1]
查看完整版本: [已解决]**多玩网页采集,访问出错,请求帮助,感谢。