火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1479|回复: 2

抓取的数据校验规则 - 新手火车“司机”求助

[复制链接]
发表于 2012-11-25 10:34:12 | 显示全部楼层 |阅读模式
昨天扒的数据里面发现有些明显的错误(404错误,目标网站反扒加入的胡乱的内容),其实这些数据在收集的时候都可以明显判断(例如某个标签的数据为空),不知道火车头能否支持这样的逻辑判断?
1. 基于规则的采集成功与否的判断
2. 如果未成功不写入结果数据库
3. 如果未成功不在组曲网址列表中删除该网址

有谁知道如何解决这个问题?多谢了!新手上路需要指导!万分感谢!
发表于 2012-11-25 11:20:28 | 显示全部楼层
你可以在标签里设置该标签不得为空就行了
 楼主| 发表于 2012-11-25 15:39:04 | 显示全部楼层
303718 发表于 2012-11-25 11:20
你可以在标签里设置该标签不得为空就行了

看到了,兄弟你太伟大了!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-15 22:01

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表