火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4925|回复: 5

建议不要重复检测已采集的网址

[复制链接]
发表于 2012-6-7 10:42:31 | 显示全部楼层 |阅读模式
采集网址的时候,有些网址采集不成功,就需要重新采集一次网址。但是采集网址每次都是所有的网址都重新检测的,能不能像采集内容那样子,如果一级网址已采集过的话,就不再检测二级网址了,或者能否根据数据库的网址记录直接跳过已采集过的一级网址,这样可以快点。因为二级网址很多,每次都检测已采集的二级网址,需要好多时间。
发表于 2012-6-7 10:51:02 | 显示全部楼层
这里可以设置的呢

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2012-6-7 11:10:54 | 显示全部楼层
这个是直接如果重复,会跳过所有的网址采集的
 楼主| 发表于 2012-6-7 11:11:41 | 显示全部楼层
例如,如果我的第一个二级网址重复了,会跳过所有的网址采集,采集内容的
 楼主| 发表于 2012-6-7 11:14:49 | 显示全部楼层
303718 发表于 2012-6-7 10:51
这里可以设置的呢

这个是直接如果有一个一级网址重复了,就会跳过所有的网址采集的
发表于 2016-2-10 19:10:15 | 显示全部楼层
支持火车。。。。历史帖子回顾中。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 03:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表