找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3758|回复: 4

建议完善中文分词功能

[复制链接]
发表于 2014-8-15 16:23:37 | 显示全部楼层 |阅读模式
现在的中文分词功能,有是有了,但是很多词语都不完善。建议新版的火车头分词组件可以借鉴一下:python 的结巴分词,或者中科院分词系统。我现在使用的是v8版本。

希望新版火车头能够集成python 的结巴分词系统就完美了。或者能够使用python作为开发插件的语言。而不仅仅只是c#和php,相信在用户群中,会用python的人数量不少。因为python它使用方便,很容易实现各种功能。这样,我们就能在火车头的基础上,实现各种功能了。
 楼主| 发表于 2014-8-30 20:16:24 | 显示全部楼层
官方不理吗            
发表于 2014-10-8 23:28:06 | 显示全部楼层
目前的分词确实不够完善,只能自己集成了
发表于 2015-1-22 17:26:52 | 显示全部楼层
确实很需要啊,现在分词还不怎么好的
发表于 2016-2-10 23:28:50 | 显示全部楼层
这个好多人提了,希望更新
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表