ws123 发表于 2009-1-1 15:50:40

发现循环分页采实在有点弱,N多错漏

发现循环分页采实在有点弱,N多错漏。

采优酷的50集的电视剧,第2、3页的采回第1页的内容了。

马克思助手有点厉害,可是不能发布。

vus520 发表于 2009-1-1 16:01:12

采优酷的50集的电视剧,第2、3页的采回第1页的内容了
规则写错了?

ws123 发表于 2009-1-1 16:08:23

本帖最后由 ws123 于 2009-1-1 16:09 编辑

不是写错

同一个规则,测试N次,有一半是会出现这种情况,有个别时候是能正确采到内容的。

奇怪,难道你们就没有出现过这种现象?

ws123 发表于 2009-1-1 16:43:42

本帖最后由 ws123 于 2009-1-1 17:37 编辑

发现是分页代码写的不够精简,简化了一下分页代码,准确率大大提高。

原来的分页代码设置是,
左:<!--分页-->
   <div class="pageBar">
      <div class="page f_r">
右:   </div>
       </div>
    <!--listData end-->
现在修改为,
左:<div class="pageBar">
      <div class="page f_r">
右</div>
       </div>
    <!--listData end-->

即去除<!--分页-->。
呵呵,谢谢在座各位。

tetest 发表于 2009-1-4 21:17:53

我第二页后都只能采到第一个回复,更郁闷

wap8844 发表于 2009-1-5 14:09:45

我也出现过这样类似的问题···
比如采集文章
分页开始
<a href="
结束
评论
上下页模式
评论是(0)就能正确采集完
要是评论(1),就是有评论的时候最后一页就采集不到
我改成这样
分页开始
<a href="
结束
评论</a>
上下页模式
这样就能完整的采集完
建议楼主多对比几个不同的页面
多试几次··

beyond521 发表于 2009-1-22 23:45:59

楼主多琢磨一下吧,告诉你吧,你只针对“下一页”这个链接入手就可以了,然后不要选择全部列出模式

ws123 发表于 2009-2-28 19:58:00

呵呵
现在新版已经可以无错循环分页采了
页: [1]
查看完整版本: 发现循环分页采实在有点弱,N多错漏