火车头可以避免论坛帖子重复采集吗
本帖最后由 pkuh 于 2009-3-8 18:28 编辑比如说这一贴,在第一页时就是这个,
http://bbs.locoy.com/spider-36239-1-1.html
但沉下去第二页,第三页就变成了这样
http://bbs.locoy.com/spider-36239-1-2.html
http://bbs.locoy.com/spider-36239-1-3.html
如果这样会不会重复采集??有什么办法可以避免?? 在采集地址里面设置相应的规则 排除掉帖子的分页 火车头做了周密的设计,完全可以避免重复采集的!不信你试试
多实践才是硬道理! 努力了,就离成功不远了 不懂呀,有没有教程呀,具体是什么哪里 火车头 是万能的只怕你不能
页:
[1]