blizzard_xue 发表于 2012-12-7 14:20:04

求指点,各位大虾,大神乱入

采集网址:http://www.miniinthebox.com/remote-control_c4738(采集此网站的分页)
分页处源码:<li class="pageIndex">
                                                                        <strong>1</strong>
                                        <a href="http://www.miniinthebox.com/remote-control_c4738/2.html">2</a>
                                        <a href="http://www.miniinthebox.com/remote-control_c4738/3.html">3</a>
                                        <a href="http://www.miniinthebox.com/remote-control_c4738/4.html">4</a>
                                                        <i>...</i>
                                                        <a href="http://www.miniinthebox.com/remote-control_c4738/12.html">12</a>

使用多级网址采集规则中的一种方式进行采集(网址获取选项;Http请求方式;列表分页获取;附加参数),自己试过但是不能将12页全部采集成功,请大神指点!
页: [1]
查看完整版本: 求指点,各位大虾,大神乱入