[已解决]**多玩网页采集,访问出错,请求帮助,感谢。
本帖最后由 没吃饱的熊 于 2012-2-17 18:58 编辑http://db.duowan.com/wow/item-25.html
多玩魔兽数据库网页,需要采集标题。浏览器访问正常,但放到 火车采集器2010sp3 中测试,提示如下错误:
http://db.duowan.com/wow/item-25.html访问出错,出错代码:
错误信息:The server committed a protocol violation. Section=ResponseHeader Detail=CR must be followed by LF
类似网页,比如178的数据网页,测试和采集都没问题,例如:http://db.178.com/wow/cn/item/25.html
请求帮助,感谢。 【标题】:破损的短剑 - 物品 - NGA178魔兽世界数据库 - 国服4.3.0
【内容】:
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>破损的短剑 - 物品 - NGA178魔兽世界数据库 - 国服4.3.0</title>
<meta http-equiv="X-UA-Compatible" content="IE=7" />
<meta name="keywords" content="NGA/178魔兽世界数据库,巫妖
测试没有问题 178和duowan这2个站的数据结构都是一样的 - - 本帖最后由 没吃饱的熊 于 2012-2-17 14:27 编辑
晕倒,楼上用的哪个火车版本呀?操作系统是什么呢?
我这里就是不行,郁闷死。
另外,你采集的内容是178的,不是多玩的啊。。。 在全局设置里----http设置----AllowUnsafeHeaderParsing勾选上 caziyo 发表于 2012-2-17 16:32 static/image/common/back.gif
在全局设置里----http设置----AllowUnsafeHeaderParsing勾选上
非常非常感谢,问题解决了!!!ali14ls http://wpa.qq.com/pa?p=2:972130397:47,为您解决采集难题
页:
[1]