火车头先生一定要看一下这个最好的建议!
实现有选择地采集,例如,如果标题或内容标签中含有“房地产”或“土地”关键词,就采集入库;如果标题或内容中不含有“房地产”或“土地”关键词,就不采集入库。方法很简单:只要再以下这个“内容排除”地方,增加一个“内容包含”判断语句,就可以的。道理一样。
http://www.tax.org.cn/upfile/1/20082/21668623600f.JPG 不错,好意见
支持
好建议,支持一下 这个功能从现在的版本其实也可以基本上实现,只是在于一个后期的筛选.再补充一个好建议,大家支持一下哦!
还增加一个:如果标题、内容等标签(可自己设置为哪几个)中含有AAAA或BBBB或其他关键词则放弃采集!请火车头先生明确回答一下吧
这个功能在技术上不难,而且其他跟火车头采集器竞争的同类产品还没有,也是广大客户的需求。 如果已经采集进来再去筛选,就耗费时间、占用数据库空间.也就是说,在进行采集之前,先执行这个筛选语句,符合的则采集。只要事先设置好筛选规则,完全可以做到自动的、有选择地采集。 不是在后续的筛选,要事先。思考:如有8000个自动运行的采集任务,1年365天,你每次事后人工去做 爪,以后学习下。。
页:
[1]