下个版本能否增加 关键字列表 中有的标题内容选择性采集
火车头采集器中对url包含特定字符才会采集的功能很实用,同时采集对标题中包含特定关键字才会采集的功能,我觉着也挺有用处的。比如,要采集的页面有很多内容:
http://q.blog.sina.com.cn/cinemas/article_new/
而我们只需要标题中含有所设关键词列表中的内容,比如关键字列表为:影讯,影片,这时候通过url包含特定字符是无法做到的,如果能过滤掉标题中关键词列表(比如:影讯,影片)没有的文章,只采集关键字列表有的文章,这样能更准确的获得分类信息。
不知道是否能增加这类的功能呢,只采集标题内含关键词的文章。
[ 本帖最后由 helps 于 2007-4-17 16:22 编辑 ] :) 支持 新版本中采集和发布是分开的,你可以选择性的发布需要的文章
页:
[1]