火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4768|回复: 7

火车头先生一定要看一下这个最好的建议!

[复制链接]
发表于 2008-2-16 19:04:55 | 显示全部楼层 |阅读模式
实现有选择地采集,例如,如果标题或内容标签中含有“房地产”或“土地”关键词,就采集入库;如果标题或内容中不含有“房地产”或“土地”关键词,就不采集入库。
    方法很简单:只要再以下这个“内容排除”地方,增加一个“内容包含”判断语句,就可以的。道理一样。
发表于 2008-2-16 20:00:05 | 显示全部楼层
不错,好意见
发表于 2008-2-16 23:09:40 | 显示全部楼层

支持

好建议,支持一下
发表于 2008-2-17 16:10:46 | 显示全部楼层
这个功能从现在的版本其实也可以基本上实现,只是在于一个后期的筛选.
 楼主| 发表于 2008-2-18 09:13:50 | 显示全部楼层

再补充一个好建议,大家支持一下哦!

还增加一个:如果标题、内容等标签(可自己设置为哪几个)中含有AAAA或BBBB或其他关键词则放弃采集!
 楼主| 发表于 2008-2-19 22:07:15 | 显示全部楼层

请火车头先生明确回答一下吧

这个功能在技术上不难,而且其他跟火车头采集器竞争的同类产品还没有,也是广大客户的需求。
 楼主| 发表于 2008-2-20 11:35:19 | 显示全部楼层
如果已经采集进来再去筛选,就耗费时间、占用数据库空间.也就是说,在进行采集之前,先执行这个筛选语句,符合的则采集。只要事先设置好筛选规则,完全可以做到自动的、有选择地采集。 不是在后续的筛选,要事先。思考:如有8000个自动运行的采集任务,1年365天,你每次事后人工去做
发表于 2016-2-10 09:17:44 | 显示全部楼层
爪,以后学习下。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 16:26

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表