helps 发表于 2007-4-17 16:20:43

下个版本能否增加 关键字列表 中有的标题内容选择性采集

火车头采集器中对url包含特定字符才会采集的功能很实用,同时采集对标题中包含特定关键字才会采集的功能,我觉着也挺有用处的。

比如,要采集的页面有很多内容:
http://q.blog.sina.com.cn/cinemas/article_new/

而我们只需要标题中含有所设关键词列表中的内容,比如关键字列表为:影讯,影片,这时候通过url包含特定字符是无法做到的,如果能过滤掉标题中关键词列表(比如:影讯,影片)没有的文章,只采集关键字列表有的文章,这样能更准确的获得分类信息。

不知道是否能增加这类的功能呢,只采集标题内含关键词的文章。

[ 本帖最后由 helps 于 2007-4-17 16:22 编辑 ]

xyyfx 发表于 2007-4-17 19:54:07

:)

netdream 发表于 2007-4-29 17:31:55

支持

火车头 发表于 2007-4-30 18:37:50

新版本中采集和发布是分开的,你可以选择性的发布需要的文章
页: [1]
查看完整版本: 下个版本能否增加 关键字列表 中有的标题内容选择性采集