如何做到这样采集全站的所有信息分类?
我想根据起始网址的不同特征,实现一次采集全站的所有分类。比如如果起始地址是http://ww.abc.com/def.asp?id=1(化工类)http://www.abc.com/def.asp?id=2 (机械类) http://www.abc.ocm/def.asp?id=3 (矿山类) ..........这样的情况,那么如何才能在采集的规则中区别id的不同值,从而实现采集全部分类呢?
换句话说,火车头能不能在采集规则中调用起始地址的一部分作为采集标志呢?
如果不能,请给出一个适合这种情况的采集方法,谢谢。 如果模板一样的话好说
如果不一样 那么按照楼主所说 以后采集所有网站的内容都可以再一个任务中实现了 几位管理员(或版主)有何高见?如何根据起始地址中某一参数的不同值,一次性采集全站的所有分类?(比如起始地址中有一参数ID,如果ID=1,我就将其采入我站的化工设备类,如果ID=2,我就将其采入我站的冶金设备类,等等。) 如果能这样,那采集就方便多了。
页:
[1]