火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3930|回复: 5

火车头的重复检测跳过功能,希望可以应用到404或者采集不到的情况。

[复制链接]
发表于 2013-6-7 18:05:36 | 显示全部楼层 |阅读模式
本帖最后由 caijihome 于 2013-6-7 18:14 编辑

有些网站,数据比较多。
栏目比较多,或者关键词比较多。
我直接设置最大页码,比如全部设置 100页。

能不能火车头在采网址的时候这样!!连续N条 采集不到网址的时候跳过改组 多页网址

同理 404 。连续 多页网址 打不开,就不要继续向后面蹦了。效率低着呢。
 楼主| 发表于 2013-6-7 18:06:55 | 显示全部楼层
这样一来,我是不是不用管他们多少页? 连续 10个列表采集不到东西。直接跳过不采集了。

是连续,不是积累,加上这个功能吧!!
 楼主| 发表于 2013-6-13 14:01:36 | 显示全部楼层
POST规则亦如此。批量的话。无法一个一个设置页码,希望火车头自动一点。
发表于 2013-6-29 17:21:15 | 显示全部楼层
建议增加  带特定 字符串跳过!!
 楼主| 发表于 2013-7-1 20:31:19 | 显示全部楼层
90seoboy 发表于 2013-6-29 17:21
建议增加  带特定 字符串跳过!!

啥意思,这个本身有这个功能吧。过滤
发表于 2016-2-10 16:01:46 | 显示全部楼层
和你们一块学习。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 03:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表