(已解决)如何把这样的分页采集齐?
即未全部列出,又非上、下页,如下:共18张 首页 1 2 3 4 5 6 7 8 9 10 11 12 13 末页
点击到后面几页是这样:
共18张 首页 6 7 8 9 10 11 12 13 14 15 16 17 18 末页
现在不管用全部列出还是上、下页,都只能采集到14页,其中包括最前的13页和最后一页(末页),在上例中就是第18页。
高手指教,有没有办法把其他页采集齐。
附:代码
<dt>共20张
<a class="page" target="_self" href="http://pic.dc.yesky.com/pic/bizhi/kuanpin/201/485701d.shtml">上一组</a>
<a class="page" href="485705d.shtml" target="_self"><span>1</span></a>
<a class="page" href="485705d_1.shtml" target="_self">2</a>
<a class="page" href="485705d_2.shtml" target="_self">3</a>
<a class="page" href="485705d_3.shtml" target="_self">4</a>
<a class="page" href="485705d_4.shtml" target="_self">5</a>
<a class="page" href="485705d_5.shtml" target="_self">6</a>
<a class="page" href="485705d_6.shtml" target="_self">7</a>
<a class="page" href="485705d_7.shtml" target="_self">8</a>
<a class="page" href="485705d_8.shtml" target="_self">9</a>
<a class="page" href="485705d_9.shtml" target="_self">10</a>
<a class="page" href="485705d_10.shtml" target="_self">11</a>
<a class="page" href="485705d_11.shtml" target="_self">12</a>
<a class="page" href="485705d_12.shtml" target="_self">13</a>
<a class="page" target="_self" href=485705d_19.shtml>末页</a></dt>
在此列出的都能采集到,但13页后除末页外均不能采集。
[ 本帖最后由 madaha 于 2008-8-4 10:02 编辑 ] 你写上下页模式即可 谢谢版主回复!
但如果写上下页模式能解决问题的话,我就不来发贴求助于了。
“现在不管用全部列出还是上、下页,都只能采集到14页,其中包括最前的13页和最后一页(末页)” 发你规则上来 关注...需要活跃度... 谢谢管理员关心!问题已经解决。
再看一下该站的分页特点:
共20张 上一组 1 2 3 4 5 6 7 8 9 10 11 12 13 末页 (第一页)
共20张 首页 1 2 3 4 5 6 7 8 9 10 11 12 13 末页 (中间页)
共20张 首页 8 9 10 11 12 13 14 15 16 17 18 19 20 末页 (中间页)
共20张 首页 8 9 10 11 12 13 14 15 16 17 18 19 20 下一组 (末页)
采集内容页,即第一页,不是“首页、页码、末页”,而是“上一组”。
正是这个上一组,让火车的上、下页模式不工作了。
解决方法很简单,直接将采集的内容页手工定位到第二页即可。 学习一下,好像挺难的呀!
页:
[1]