powerc 发表于 2009-12-20 23:01:54

关于采集网址规则中只想取前5条进行采集应该如何设置?

如列表页是:http://bbs.abc.cn/forum-12-1.html经过分析得到二级采集网址若干:
http://bbs.abc.cn/thread-2051625-1-1.html
http://bbs.abc.cn/thread-2051825-1-1.html
http://bbs.abc.cn/thread-2051815-1-1.html
http://bbs.abc.cn/thread-2051723-1-1.html
http://bbs.abc.cn/thread-2051134-1-1.html
http://bbs.abc.cn/thread-2051235-1-1.html
http://bbs.abc.cn/thread-2051667-1-1.html
http://bbs.abc.cn/thread-2051931-1-1.html
... ...
例如我只想采集前面5条网址的内容而不是全部采集应该在哪里设置?

还有当我采完后,过半小时又进行采集的时候,如果碰到我采过的网址会不会重复采集?

连通 发表于 2009-12-21 00:05:30

没这功能.别骗自己了.就算实现.只采集前面5条网址的内容.
其实到头来花的时间还多.
页: [1]
查看完整版本: 关于采集网址规则中只想取前5条进行采集应该如何设置?