火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4183|回复: 4

请教:过滤重复网址时为何网址没重复仍然被过滤掉?

[复制链接]
发表于 2010-9-14 12:36:42 | 显示全部楼层 |阅读模式
采集数据时先分析了网址,提取到内容所在的页面共4900多个存在txt文件里,直接用0级深度采集,勾选了重复网址过滤。

但不知道为什么采集内容的时候有500多个网址显示“生成0级网址--重复网址,排除:”然后这些页面的数据就没有采集下来,但搜索txt文件里明明同一个网址只有一个,哪位大大知道这是什么原因吗?

该任务的地址库已经清空过了,还是会产生这样的问题,到底是哪里出错了呢?
 楼主| 发表于 2010-9-17 03:58:14 | 显示全部楼层
自己解决了,是因为站点地址库的问题,把站点地址库清空以后就好了
发表于 2010-10-31 22:13:01 | 显示全部楼层
是因为站点地址库的问题,  我也郁闷了半天呢,谢谢啊。。。
发表于 2010-11-3 10:35:16 | 显示全部楼层
我的还是不行啊!我重新建了一个站点,也是不行的!把以前的采集规则里面的地址库都清空了,还有 问题也!
发表于 2010-12-7 12:42:28 | 显示全部楼层
多谢楼主,确实如此。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-3 17:21

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表