关于采集网址规则中只想取前5条进行采集应该如何设置?
如列表页是:http://bbs.abc.cn/forum-12-1.html经过分析得到二级采集网址若干:http://bbs.abc.cn/thread-2051625-1-1.html
http://bbs.abc.cn/thread-2051825-1-1.html
http://bbs.abc.cn/thread-2051815-1-1.html
http://bbs.abc.cn/thread-2051723-1-1.html
http://bbs.abc.cn/thread-2051134-1-1.html
http://bbs.abc.cn/thread-2051235-1-1.html
http://bbs.abc.cn/thread-2051667-1-1.html
http://bbs.abc.cn/thread-2051931-1-1.html
... ...
例如我只想采集前面5条网址的内容而不是全部采集应该在哪里设置?
还有当我采完后,过半小时又进行采集的时候,如果碰到我采过的网址会不会重复采集? 没这功能.别骗自己了.就算实现.只采集前面5条网址的内容.
其实到头来花的时间还多.
页:
[1]