火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2247|回复: 3

请问,采集的分页重复了,怎么解决

[复制链接]
发表于 2010-8-9 09:43:32 | 显示全部楼层 |阅读模式
本帖最后由 TongKing 于 2010-8-9 13:20 编辑

【内容】里没有把分页囊括在内,采集回来的前2个网址是同样的内容了,怎么排除只采一个,研究了整个晚上都弄不好,麻烦帮忙一下,下面是代码。

这2个地址的内容是一样的,怎么在采集分页里排除一个?
  1. /bencandy.php?fid=1&id=1908
  2. /bencandy.php?fid=1&aid=1908&page=1
复制代码
  1.                           <!--//投票-->
  2.                     

  3.               
  4.               <tr>
  5.                 <td height="30" valign="bottom">
  6.                                 <div id="nexttext">
  7.                                
  8. <a href="bencandy.php?fid=1&aid=1908&page=1" title="首页">首页</A> <a href="bencandy.php?fid=1&aid=1908&page=1" title="上一页">上一页</A>   <a href='#'><font color=red>1</font></a> <a href="bencandy.php?fid=1&aid=1908&page=2" title="第2页">2</a> <a href="bencandy.php?fid=1&aid=1908&page=3" title="第3页">3</a> <a href="bencandy.php?fid=1&aid=1908&page=4" title="第4页">4</a> <a href="bencandy.php?fid=1&aid=1908&page=5" title="第5页">5</a> <a href="bencandy.php?fid=1&aid=1908&page=6" title="第6页">6</a> <a href="bencandy.php?fid=1&aid=1908&page=7" title="第7页">7</a>  <a href="bencandy.php?fid=1&aid=1908&page=2" title="下一页">下一页</A> <a href="bencandy.php?fid=1&aid=1908&page=8" title="尾页">尾页</A> <a href='#'><font color=red>1</font>/8/8</a>
复制代码
发表于 2010-8-9 09:57:16 | 显示全部楼层
你可以 用参数来构造出 /bencandy.php?fid=1&id=1908&page=1
直接从这一页开始采集
发表于 2010-8-9 09:59:25 | 显示全部楼层
从获取当前页开始试试
<a href='#'><font color=red>(*)</font></a>
 楼主| 发表于 2010-8-9 13:19:40 | 显示全部楼层
感谢LS两位,问题解决
用 wxl08 这位朋友的方法可以采集好
谢谢。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-18 20:38

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表