hailong1900 发表于 2014-1-19 22:59:43

火车头升级以后原来的规则就不能采集了!各位老大帮看看

这个规则一直没有修改过,今天想更新下网站竟然提示错误,错误内容如下


【内容】不符合不得为空设置,被标记为未采,记录Id2,记录网址http://www.XXXXXXX.com/sch/Business-Industrial-/12576/i.html?_udlo=100&_from=R40&LH_ItemCondition=1000&_udhi=&_nkw=parker&rt=nc
当前记录符合过滤要求,已经被标记为未采:id2,网址:http://www.XXXXXXX.com/sch/Business-Industrial-/12576/i.html?_udlo=100&_from=R40&LH_ItemCondition=1000&_udhi=&_nkw=parker&rt=nc


测试采集的时候 也获取不到采集的文章页面内容

测试获取不到内容 提示如下

【标题】:Bosch 3pcs Pro Set
【内容】:不符合不得为空设置,实际采集时将标记为未采
【作者】:
【时间】:
【出处】:


为什么规则一点没有改变前几天升级版本后 就不能采集了? 怎么解决啊

303718 发表于 2014-1-20 08:28:04

没有采集到内容了应该是对应网站有改变。修改采集规则应该行的

hailong1900 发表于 2014-1-20 09:24:40

303718 发表于 2014-1-20 08:28 static/image/common/back.gif
没有采集到内容了应该是对应网站有改变。修改采集规则应该行的

我发现了一个问题!! 火车头测试获得的文章内容页源码 和在浏览器中看到的源码不一样!! 所以造成采集不到内容   这是火车头的问题吗

anht_admin 发表于 2014-1-20 09:47:31

http://faq.locoy.com/q-754.html参考

素水山人 发表于 2014-2-12 11:44:45

hailong1900 发表于 2014-1-20 09:24 static/image/common/back.gif
我发现了一个问题!! 火车头测试获得的文章内容页源码 和在浏览器中看到的源码不一样!! 所以造成采集 ...

这个不是问题,用IE内核的浏览器看
页: [1]
查看完整版本: 火车头升级以后原来的规则就不能采集了!各位老大帮看看