hzd888 发表于 2008-2-20 10:35:37

建议:增加一个实现有选择地采集的功能

建议:增加一个实现有选择地采集的功能,应该很容易实现----无非就是采集器中加一个判断语句(IF 标签A、B LIKE'%关键词1、关键词2%'THEN ...)而已。例如,如果标题或内容标签中含有“房地产”或“土地”关键词,就采集入库;如果标题或内容中不含有“房地产”或“土地”关键词,就不采集入库。

hzd888 发表于 2008-2-20 11:35:52

如果已经采集进来再去筛选,就耗费时间、占用数据库空间.也就是说,在进行采集之前,先执行这个筛选语句,符合的则采集。只要事先设置好筛选规则,完全可以做到自动的、有选择地采集。 不是在后续的筛选,要事先。思考:如有8000个自动运行的采集任务,1年365天,你每次事后人工去做

hzd888 发表于 2008-2-24 00:13:31

期待下个补丁解决这个问题!!!!!!!!!!!!!!!!!

fireye 发表于 2008-2-24 01:21:23

不错的建议呼的。

lbjyuer 发表于 2016-2-10 09:12:05

爪,以后学习下。。
页: [1]
查看完整版本: 建议:增加一个实现有选择地采集的功能