火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 18911|回复: 13

设置采集内容不得为空,必须包含,不得包含~~~

[复制链接]
发表于 2013-5-7 17:19:59 | 显示全部楼层 |阅读模式
1,设置标签采集结果不得为空



编辑标签状态下 数据处理 最下面有个内容过滤 选择下

就看到右侧很多选项了“内容不得重复”“内容不得为空”“内容必须包含”“内容不得包含”

还有当内容长度不符合要求的时候时候过滤

这些都是很能看明白的东西吧



上图 不得包含和必须包含那里的“|”“↑” 解释说明 注意下


2,设置好了 你希望采集器如何处理这些不符合你要求的数据呢 看下图



在第四步“文件保存及部分高级设置” 右下角 ,看到了吧 2个选项

一个是删除 删除的话就是把这条信息删除掉,

一个是标记为未采集  是把这数据标记为未采集  下次运行任务的时候这条数据会被从新采集

这个的好处就是,当你是因为网速,或者别的原因采集不到数据的时候,

多运行又可以采集到,你就可以设置

为 未采集 等任务运行完了,你只要勾选采集内容 不要勾选采集网址  

采集器就会把这些没有采集到的信息又从新采集一遍的

这样就保证数据的完整性,可以重复多次 我一般采集数据都会这样设置的,

希望你能明白我在说什么 不明白就算了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2013-5-14 14:25:11 | 显示全部楼层
  学习下 , 很不错
发表于 2013-5-20 16:46:32 | 显示全部楼层
顶一下,哈,学习了
发表于 2013-9-1 19:30:06 | 显示全部楼层
蛮啰嗦的  有图没重点
不过  谢谢
发表于 2013-11-28 20:02:08 | 显示全部楼层
还好,奖励鲜花一个哦
发表于 2013-12-2 17:29:29 | 显示全部楼层
顶一下,我感觉好可以,学习了
发表于 2013-12-15 23:23:35 | 显示全部楼层
{:soso_e178:}谢谢楼主无私分享,好好学习了。
发表于 2014-4-19 22:36:21 | 显示全部楼层
顶一个,学习中....
发表于 2014-4-22 19:06:57 | 显示全部楼层
没有发现这些问题,不过好奇害死猫,不得不看的帖子是好帖子
发表于 2014-5-11 22:36:50 | 显示全部楼层
有没有机会大家一起交流下呢
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-12-27 03:25

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表