貌似很简单,如何采集规则网址的内容?
我设定了采集 http://db.178.com/wow/cn/item/(*).html,(*)是17~25,采集物品的名字和描述。但是,火车头把我要的内容一个都没采集,反而把这些页面内的链接都采集了,我晕死了啊!采集深度已经能够设置了0,但依然拼命采集我不需要的内容。
请高手解答下,看似如此简单的需求,为什么火车头却“答非所问”呢? 帮顶下 帮顶下:lol 这个还是你的规则的问题!采集规则的问题,实际上是可以采集的! 感觉是软件bug。
我初始设置的时候,没注意深度问题,默认1。之后我发现采集的内容不对,修改深度为0,但系统依然认为深度是1。
我删掉认原任务,重新建立就可以了。
页:
[1]