请教下同义词替换功能,顺便提个建议
今天下载了论坛里的同义词库照着做了发现个问题,就是会重复替换,相当于没替换了
用火车自带的论坛采集测试
例如,替换规则这样写
声明→公告
公告→声明
我想得到的效果是采集时遇到 声明→公告
遇到 公告→声明 只替换一遍就够了
可是这样做的效果就是替换到最后都是声明
能不能增加个功能就是先替换的词组自动加上个保护标签,
如果是先替换声明→公告,就给替换好了的公告 加上个保护标签 [保护]公告[/保护],
扫描下个规则 公告→声明时因为遇到这个保护标签[保护]公告[/保护]就自动滤过,不进行替换,而对没有[保护]公告[/保护] 的 公告 就替换
最后的替换规则完成后再删除保护标签[保护] [/保护]
或者是整个项目完成后在数据库里替换,就不影响采集时速度
这样就能达到不重复替换的效果
[ 本帖最后由 ana101 于 2008-12-9 22:47 编辑 ] 没有这类的事的.这个功能是收费版的功能.免费版没有的. 原帖由 飛越無限 于 2008-12-9 22:56 发表 http://bbs.locoy.com/images/common/back.gif
没有这类的事的.这个功能是收费版的功能.免费版没有的.
我的是免费版的,论坛里有免费的同义词库下载,8000多,3000多几种都有啊
收费版的我不清楚是不是也是这样替换的
我使用的是内容替换功能,希望能实现上面说的功能效果,方便同义近义替换 没有用过 版主用的也是免费的吧????? 版版的箱子怎么是负的? 我我也不执拗是怎么搞的snk99.cn!!!! 看看再说
页:
[1]