找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2438|回复: 3

重复爬取信息内容什么鬼

[复制链接]
发表于 2017-11-10 17:35:01 | 显示全部楼层 |阅读模式
任务规则没有问题,进行日常的更新,为什么之前的爬取过得数据还会一直重复的爬取
发表于 2017-11-13 10:22:04 | 显示全部楼层
网址会默认过滤重复的
 楼主| 发表于 2017-11-14 13:50:55 | 显示全部楼层
leweizxl 发表于 2017-11-13 10:22
网址会默认过滤重复的

对啊,可是比如第一次爬,爬全部的,第二次爬只是爬取更新的,以前爬的没有爬取。到了第三次,就又开始爬取全部的。是这种情况。
发表于 2017-11-14 14:10:26 | 显示全部楼层
wx_f7k8V79D 发表于 2017-11-14 13:50
对啊,可是比如第一次爬,爬全部的,第二次爬只是爬取更新的,以前爬的没有爬取。到了第三次,就又开始爬 ...

如果是过滤重复内容的话  可以考虑用过滤删除的设置
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表