madaha 发表于 2008-8-1 00:15:31

(已解决)如何把这样的分页采集齐?

即未全部列出,又非上、下页,如下:

共18张   首页 1 2 3 4 5 6 7 8 9 10 11 12 13 末页

点击到后面几页是这样:

共18张   首页 6 7 8 9 10 11 12 13 14 15 16 17 18 末页

现在不管用全部列出还是上、下页,都只能采集到14页,其中包括最前的13页和最后一页(末页),在上例中就是第18页。

高手指教,有没有办法把其他页采集齐。

附:代码

<dt>共20张   
<a class="page" target="_self" href="http://pic.dc.yesky.com/pic/bizhi/kuanpin/201/485701d.shtml">上一组</a>
<a class="page" href="485705d.shtml" target="_self"><span>1</span></a>
<a class="page" href="485705d_1.shtml" target="_self">2</a>
<a class="page" href="485705d_2.shtml" target="_self">3</a>
<a class="page" href="485705d_3.shtml" target="_self">4</a>
<a class="page" href="485705d_4.shtml" target="_self">5</a>
<a class="page" href="485705d_5.shtml" target="_self">6</a>
<a class="page" href="485705d_6.shtml" target="_self">7</a>
<a class="page" href="485705d_7.shtml" target="_self">8</a>
<a class="page" href="485705d_8.shtml" target="_self">9</a>
<a class="page" href="485705d_9.shtml" target="_self">10</a>
<a class="page" href="485705d_10.shtml" target="_self">11</a>
<a class="page" href="485705d_11.shtml" target="_self">12</a>
<a class="page" href="485705d_12.shtml" target="_self">13</a>
<a class="page" target="_self" href=485705d_19.shtml>末页</a></dt>

在此列出的都能采集到,但13页后除末页外均不能采集。

[ 本帖最后由 madaha 于 2008-8-4 10:02 编辑 ]

sushy 发表于 2008-8-1 08:51:27

你写上下页模式即可

madaha 发表于 2008-8-1 09:53:46

谢谢版主回复!

但如果写上下页模式能解决问题的话,我就不来发贴求助于了。

“现在不管用全部列出还是上、下页,都只能采集到14页,其中包括最前的13页和最后一页(末页)”

rq204 发表于 2008-8-1 12:53:59

发你规则上来

ghostscat 发表于 2008-8-1 16:11:07

关注...需要活跃度...

madaha 发表于 2008-8-4 09:40:07

谢谢管理员关心!问题已经解决。

再看一下该站的分页特点:

共20张   上一组 1 2 3 4 5 6 7 8 9 10 11 12 13 末页                     (第一页)
共20张   首页 1 2 3 4 5 6 7 8 9 10 11 12 13 末页                        (中间页)
共20张   首页 8 9 10 11 12 13 14 15 16 17 18 19 20 末页            (中间页)
共20张   首页 8 9 10 11 12 13 14 15 16 17 18 19 20 下一组         (末页)

采集内容页,即第一页,不是“首页、页码、末页”,而是“上一组”。

正是这个上一组,让火车的上、下页模式不工作了。

解决方法很简单,直接将采集的内容页手工定位到第二页即可。

李巨华 发表于 2008-11-8 11:33:09

学习一下,好像挺难的呀!
页: [1]
查看完整版本: (已解决)如何把这样的分页采集齐?