火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3049|回复: 3

入库标题重复过滤问题指教达人?

[复制链接]
发表于 2007-10-16 12:24:48 | 显示全部楼层 |阅读模式
3.2版中能不能设置采集的标题相同时就不再采集入库,这样就可以避免重复采集很多内容,因为不同的网站有相同的内容,光靠链结不同来区别根本不能解决这个大问题,本人是新人,不知目前的板本中是否有能设置过滤的开关,有的话请火车达人指教了。
发表于 2007-10-16 20:10:53 | 显示全部楼层
在火车全局设置里可以选择

另外如果楼主采集完毕后,清理了任务的地址库,又从新采集的话,这一招就不行了

可以在CMS或BBS的程序里加入IF的变量买来限定发布的主题

可以参考discuz论坛的一个插件“防止重复发帖插件”
 楼主| 发表于 2007-10-18 01:07:15 | 显示全部楼层
原帖由 tianyuxuan 于 2007-10-16 20:10 发表
在火车全局设置里可以选择

另外如果楼主采集完毕后,清理了任务的地址库,又从新采集的话,这一招就不行了

可以在CMS或BBS的程序里加入IF的变量买来限定发布的主题

可以参考discuz论坛的一个插件“防止重复 ...

在火车全局设置里可以选择
找不到哈,你可能是收费板吧,俺可不是
发表于 2007-10-25 08:43:02 | 显示全部楼层
同就问题解决办法
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-23 17:54

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表