求指点,各位大虾,大神乱入
采集网址:http://www.miniinthebox.com/remote-control_c4738(采集此网站的分页)分页处源码:<li class="pageIndex">
<strong>1</strong>
<a href="http://www.miniinthebox.com/remote-control_c4738/2.html">2</a>
<a href="http://www.miniinthebox.com/remote-control_c4738/3.html">3</a>
<a href="http://www.miniinthebox.com/remote-control_c4738/4.html">4</a>
<i>...</i>
<a href="http://www.miniinthebox.com/remote-control_c4738/12.html">12</a>
使用多级网址采集规则中的一种方式进行采集(网址获取选项;Http请求方式;列表分页获取;附加参数),自己试过但是不能将12页全部采集成功,请大神指点!
页:
[1]