请问,采集的分页重复了,怎么解决
本帖最后由 TongKing 于 2010-8-9 13:20 编辑【内容】里没有把分页囊括在内,采集回来的前2个网址是同样的内容了,怎么排除只采一个,研究了整个晚上都弄不好,麻烦帮忙一下,下面是代码。
这2个地址的内容是一样的,怎么在采集分页里排除一个?/bencandy.php?fid=1&id=1908
/bencandy.php?fid=1&aid=1908&page=1http://www.cocplay.com/1.jpg <!--//投票-->
<tr>
<td height="30" valign="bottom">
<div id="nexttext">
<a href="bencandy.php?fid=1&aid=1908&page=1" title="首页">首页</A> <a href="bencandy.php?fid=1&aid=1908&page=1" title="上一页">上一页</A> <a href='#'><font color=red>1</font></a> <a href="bencandy.php?fid=1&aid=1908&page=2" title="第2页">2</a> <a href="bencandy.php?fid=1&aid=1908&page=3" title="第3页">3</a> <a href="bencandy.php?fid=1&aid=1908&page=4" title="第4页">4</a> <a href="bencandy.php?fid=1&aid=1908&page=5" title="第5页">5</a> <a href="bencandy.php?fid=1&aid=1908&page=6" title="第6页">6</a> <a href="bencandy.php?fid=1&aid=1908&page=7" title="第7页">7</a><a href="bencandy.php?fid=1&aid=1908&page=2" title="下一页">下一页</A> <a href="bencandy.php?fid=1&aid=1908&page=8" title="尾页">尾页</A> <a href='#'><font color=red>1</font>/8/8</a> 你可以 用参数来构造出 /bencandy.php?fid=1&id=1908&page=1
直接从这一页开始采集 从获取当前页开始试试
<a href='#'><font color=red>(*)</font></a> 感谢LS两位,问题解决
用 wxl08 这位朋友的方法可以采集好
谢谢。
页:
[1]