hzd888 发表于 2008-2-16 19:04:55

火车头先生一定要看一下这个最好的建议!

实现有选择地采集,例如,如果标题或内容标签中含有“房地产”或“土地”关键词,就采集入库;如果标题或内容中不含有“房地产”或“土地”关键词,就不采集入库。
    方法很简单:只要再以下这个“内容排除”地方,增加一个“内容包含”判断语句,就可以的。道理一样。
http://www.tax.org.cn/upfile/1/20082/21668623600f.JPG

fireye 发表于 2008-2-16 20:00:05

不错,好意见

Terminal 发表于 2008-2-16 23:09:40

支持

好建议,支持一下

vus520 发表于 2008-2-17 16:10:46

这个功能从现在的版本其实也可以基本上实现,只是在于一个后期的筛选.

hzd888 发表于 2008-2-18 09:13:50

再补充一个好建议,大家支持一下哦!

还增加一个:如果标题、内容等标签(可自己设置为哪几个)中含有AAAA或BBBB或其他关键词则放弃采集!

hzd888 发表于 2008-2-19 22:07:15

请火车头先生明确回答一下吧

这个功能在技术上不难,而且其他跟火车头采集器竞争的同类产品还没有,也是广大客户的需求。

hzd888 发表于 2008-2-20 11:35:19

如果已经采集进来再去筛选,就耗费时间、占用数据库空间.也就是说,在进行采集之前,先执行这个筛选语句,符合的则采集。只要事先设置好筛选规则,完全可以做到自动的、有选择地采集。 不是在后续的筛选,要事先。思考:如有8000个自动运行的采集任务,1年365天,你每次事后人工去做

lbjyuer 发表于 2016-2-10 09:17:44

爪,以后学习下。。
页: [1]
查看完整版本: 火车头先生一定要看一下这个最好的建议!