最新2010版本的采集器,首尾重复采集第一页的问题
本帖最后由 lcyj 于 2010-4-19 13:49 编辑████████████████████████████████████
█此页面包含多个分页:
█1:http://www.xxx.cn/viewthread.php?tid=148130&extra=page%3D1
█2:http://www.xxx.cn/viewthread.php?tid=148130&extra=page%3D1&page=2
█3:http://www.xxx.cn/viewthread.php?tid=148130&extra=page%3D1&page=3
█4:http://www.xxx.cn/viewthread.php?tid=148130&extra=page%3D1&page=4
█5:http://www.xxx.cn/viewthread.php?tid=148130&extra=page%3D1&page=5
█6:http://www1.xxx.cn/viewthread.php?tid=148130&extra=page%3D1&page=1
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
刚下的最新版本的采集器2010,采集DZ7.0怎么会首尾重复采集第一页呢??
测试网址是:
http://www.xxx.cn/viewthread.php?tid=148130&extra=page%3D1&page=
http://www.xxx.cn/viewthread.php?tid=148130&extra=page%3D1
能帮忙看一下这个问题吗~~~~~~~~~~ 带 page=1 和不带page程序认为是不同的地址页面。
想办法去掉原地址。或者直接从page=1的页面开始采集
页:
[1]