火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6503|回复: 10

地址库里的无效地址越来越多怎么办?

[复制链接]
发表于 2007-2-11 10:17:15 | 显示全部楼层 |阅读模式
好象有问题的地址都会在下次被重新采集,这样垃圾地址不是越来越多,并且每次工作量越来越大了么?本来列表页面只有几十个地址,现在采集一次,连同以前没有采集成功的(其实就是地址不对)一共要采集上千个地址.这些垃圾地址可以扔掉么?

请大大们指点下
发表于 2007-2-11 10:23:06 | 显示全部楼层
第一次采集时所有列表页的地址都采集;采完后,只保留最后一页,删除多余的列表页并保存设置,以后采集时就不会有太多的重复地址了。
我是这样做的
 楼主| 发表于 2007-2-11 11:11:49 | 显示全部楼层
回管理员:

我也是这么做的
第一次采集完所有页以后,把规则改为只采集第一页,以后每次只采集第一页最新的信息,即使是这样,地址也越来越多,现在基本一页都是上千条,慢的要死
发表于 2007-2-11 14:46:54 | 显示全部楼层
又不好清空地址库,那你得去地址的字段手动删除那些不需要的!
发表于 2007-2-11 16:06:13 | 显示全部楼层
原帖由 西狂曲 于 2007-2-11 11:11 发表
回管理员:

我也是这么做的
第一次采集完所有页以后,把规则改为只采集第一页,以后每次只采集第一页最新的信息,即使是这样,地址也越来越多,现在基本一页都是上千条,慢的要死

对了,还可限制采集器使用模块在线发表到网站是一个模拟浏览器提交网址的范围哦。这功能可把要采集的地址限制在最小范围内。
发表于 2007-2-11 16:17:25 | 显示全部楼层
MM说的好深奥!嘿嘿:) :victory:
发表于 2007-2-11 16:25:13 | 显示全部楼层
原帖由 netdream 于 2007-2-11 16:06 发表

对了,还可限制采集范围哦。这功能可把要采集的地址限制在最小范围内。
发表于 2007-2-11 16:26:58 | 显示全部楼层
呵呵,晕死,刚才输些什么 啊:L :L :L
发表于 2007-2-11 16:37:17 | 显示全部楼层
:) mm太累了!休息下哈!长时间对着电脑,对皮肤可不好哦!!
发表于 2007-2-11 16:51:43 | 显示全部楼层
呵呵,好的
唉,一弄起来就忘了时间,下了哈 88
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-3 10:51

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表