火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2868|回复: 3

火车头V7不检测重复采集无法做到,检测重复网址重复功能,如果不勾选,定义不充分

[复制链接]
发表于 2012-4-9 01:10:34 | 显示全部楼层 |阅读模式
检测重复网址,如果不勾选,有些重复信息还是让过滤了

假如网站A的一个B列表 含有一个C连接
    网站A的一个D列表 也含有C连接
那么我同时采集B和D列表,只会采集一个C连接出来,这个不符合不重复过滤要求把
演示规则

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2012-4-9 01:13:27 | 显示全部楼层
一句话说明

重复不过滤,火车头单次运行的时候还是过滤了。只有过滤功能,没有完全不过滤的 功能
发表于 2012-4-10 09:16:41 | 显示全部楼层
采集器的检测重复是和网址库中的网址进行对比,并不是单个任务中运行时不检测。单个任务运行时默认会对重复的网址进行排除的。
发表于 2012-4-26 17:24:14 | 显示全部楼层
rq204 发表于 2012-4-10 09:16
采集器的检测重复是和网址库中的网址进行对比,并不是单个任务中运行时不检测。单个任务运行时默认会对重复 ...

单个任务运行时默认会对重复的网址进行排除的
那么可以设置不排除吗,在哪里设置,谢谢
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 19:28

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表