火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3454|回复: 4

怎样才能暂停过滤重复采集的功能?

[复制链接]
发表于 2007-12-19 00:07:00 | 显示全部楼层 |阅读模式
有些文章会在几个任务中出现
但当我对某一条地址采集过后,要在其它任务采集就被过滤了,怎样才能暂停过滤重复采集的功能?
发表于 2007-12-19 00:23:17 | 显示全部楼层
如果你是如本地数据库,每个任务就是一个数据库表。如果你不允许其过滤,只有手工直接修改数据库中相关条的键值。
 楼主| 发表于 2007-12-19 12:16:47 | 显示全部楼层
我采集的网站, 它自己也是某些文章会在多个目录中出现, 所以我任务分类时, 跟采集的网站也差不多, 所以也会某些文章会在多个目录中出现

如果几千条, 那就没可能这样手工一条一条修改吧, 会死的
发表于 2007-12-19 12:32:10 | 显示全部楼层
有个比手工改稍微简单的办法,不仿一试。

在本地表中按标题排序,可以将所有相同或者相近的标题排到一起,再判断修改,对于多表,那实在没有什么高招了。
 楼主| 发表于 2007-12-20 11:02:17 | 显示全部楼层
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-20 08:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表