|
首页列表是 index.html
然后列表第二页的是 list_2.html
第三页列表页是list_3.html
依次内推
就那admin5做例子
采集地址:http://www.admin5.com/browse/177/index.shtml
http://www.admin5.com/browse/177/list_<1,5,1,false,false>.shtml
我测试的时候能采集到所有列表下的网址,
但正式采集的时候 他只采集
http://www.admin5.com/browse/177/index.shtml
http://www.admin5.com/browse/177/list_2.shtml
http://www.admin5.com/browse/177/list_3.shtml
http://www.admin5.com/browse/177/list_4.shtml
http://www.admin5.com/browse/177/list_5.shtml
下面的文章列表不采集! |
|