火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4503|回复: 4

有需要关键词自动提取功能的不?

[复制链接]
发表于 2010-7-29 15:32:36 | 显示全部楼层 |阅读模式
本人在苦思两天后终于找到一种免费版也能做到关键字提取的的方法,不过这需要修改ECMS文件,也就相当于二次开发吧。
发表于 2010-8-9 18:26:52 | 显示全部楼层
 楼主| 发表于 2010-8-21 20:47:38 | 显示全部楼层
回复 2# monface


   这个的关键词提取需要用的分词功能,免费版是使用不了。
发表于 2010-8-22 10:07:40 | 显示全部楼层
如果想要自动提取“关键词”、“简介” 需要自己建立个[标签:关键词]、[标签:简介](标签内容可以不设置、为空即可)人家已经实现了
你的怎么实现的?
 楼主| 发表于 2010-8-28 15:17:01 | 显示全部楼层
回复 4# monface

你有没有去试过啊?
我就算没试过也知道这样不行的,火车头的接口模块只不过是相当于传输通道,如果火车头没产生关键词,而ECMS也不会自动提取关键词,那关键词从何而来?

关键词的来源无非就三个,1、使用火车头的分词功能(免费版不能使用);2、像提取标题内容等一样,从源站点的节点中提取(原文没有则无法提取);3、ECMS在插入数据时自动提取(我所知道的是开源免费版没这功能)

我的方法是第三种,即在插入数据前,判断关键词是否为空的,如果是,就利用插件对标题和内容进行分析获取关键词。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 17:29

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表