采集内容的时候为什么将地址分割10页再采集呢,哪里设置?
本帖最后由 edzmp 于 2012-10-18 08:56 编辑比如地址是这样的
http://localhost/1.html
http://localhost/2.html
http://localhost/3.html
http://localhost/4.html
http://localhost/5.html
http://localhost/6.html
http://localhost/7.html
http://localhost/8.html
http://localhost/9.html
http://localhost/10.html
http://localhost/11.html
http://localhost/12.html
http://localhost/13.html
http://localhost/14.html
http://localhost/15.html
http://localhost/16.html
http://localhost/17.html
http://localhost/18.html
http://localhost/19.html
http://localhost/20.html
http://localhost/21.html
http://localhost/22.html
http://localhost/23.html
那么火车头就默认采内容的时候采集http://localhost/1.html、http://localhost/11.html、http://localhost/21.html、http://localhost/2.html、http://localhost/12.html了,有没有办法哪里设置称默认http://localhost/1.html、http://localhost/2.html、http://localhost/3.html这样的? 这里设置就行的了 是采集分页吗?采集分页的话,就是你的分页规则没设置好!另外这个采集顺序和线程多少有关系!规则第四步可以设置线程
页:
[1]