发新话题
打印

[3.2版] 关于tag的建议

关于tag的建议

我的意思是,其实用户使用tag。是相对整篇文章使用。而不是标题或者内容。
现在火车提供的方案:[标签:内容][标签:SY_tag]
这样有明显的弊端。会出现入库的时候有重复关键字
因为比如标题关键字有“cms”,内容也有“cms”,就重复了
同时一般情况标题的tag的重要性比内容的高。因此应该有一个词频和权重的算法。你可以公开这个算法,让用户设定到配置文件里面。比如标题的权重是10,内容可以设定成2。也就是说标题出现一个词语一次是10分,内容出现一次是2分。然后把排名前5的词作为该文章的tag。
为了避免一些比如“一个”这样的无效tag。因此还可以向用户开放一个黑名单tag。所有用户都可以共同维护这个黑名单。保证自动出来的tag是有效而有用的

TOP

支持,等火车头在来顶一下
火车头商业版购买咨询及规则&模块定制服务:
QQ:509195509&78007024已满请加QQ511566576

孤魂的淘宝网店(已经加入"消费者保障计划")


使用火车头破解版者格杀勿论,传播火车头破解版者株连九族!
+下面是广告时间+--------------------------------------------------------------------------------------
高频变压器论坛TXT小说下载
我的博客:《孤魂居》les拉拉社区

出售国内外空间,联系QQ:511566576,价格适中,性价比绝对超高!

TOP

TOP

居然官方没有来

TOP

不懂..
业余代采,弄点零钱。。要的PM我。

QQ,没时间上。就在论坛里PM我。
www.52baike.com.cn
QQ564756959   验证的时候注明“采集”  (QQ长时间不在线)

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.190540 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-24 04:25 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档