火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2601|回复: 1

2010版本第一页重复采集问题:为什么第一页会被采集两次?

[复制链接]
发表于 2010-6-8 11:17:56 | 显示全部楼层 |阅读模式
这是件很奇怪的事情:

在测试节点的时候,查看源代码发现采集是正确的,第一页只采集一次。

但在正式采集的时候,发现目标文章的第一页被采集了两次,本地编辑采集数据时,也可以看到第一页被采集了两次,重复了。

为什么测试的时候正常,而正式采集的时候却重复呢?求解。
发表于 2010-6-9 08:55:22 | 显示全部楼层
这种情况可能是你的第一页有多个不同的地址,比如一个带有page=1,一个没有带.因为采集器只是识别网址是否相同,如果不相同则不同的内容.
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 05:50

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表