火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3402|回复: 7

关于新版本的火车头针对搜索引擎优化的一点建议

[复制链接]
发表于 2008-7-4 21:49:43 | 显示全部楼层 |阅读模式
现在单纯的采集,对于我们来说已经没有什么用了,搜索引擎会k了你,那如何应付这个问题呢?有一个办法,就是我们把采集到的内容用火车头的 “内容替换”功能来处理一下,就可以把每一篇采集来的文章变成是原创的文章了 比如原文是 “老公” 我们就把它替换成“丈夫”,把"笑话"替换成"joke",把"火车头"替换成"huo che tou" ,把"办法"替换成"方法",虽然有些语句在语意上有点生硬,但是对于搜索引擎来说绝对是原创文章,收录会更好的。
      但现在有个大问题,如果要这样处理的话 我们会有很多词语需要替换,一篇文章需要处理的地方至少有 标题 内容 两部分,如果每次都要手工的写这些替换规则的话 那将是一件非常恐怖的事情。而且现在版本的火车头是不会检测所输入的内容是否在现有替换内容中是否存在 ,同一个关键字可以重复输入,一个关键字是否输入过仅凭记忆,很难提过效率。
      终上所述,我建议火车头在替换那里推出一个导入/导出规则的按钮就方便多了,同时添加监测关键字是否存在的功能。这样就不会反复的做重复工作了!
     最后AD一下 我的小站(全部火车拉来的数据)
     http://www.hahaju.com 哈哈居  幽默 笑话
     http://www.lady-vip.cn  VIP女性网
     http://movie.qv8.net     趣味吧免费电影
     有交换链接的朋友交换下吧!
发表于 2008-7-4 22:40:02 | 显示全部楼层
免费版的直接编辑数据库可以了
发表于 2008-7-4 23:24:28 | 显示全部楼层
建议倒是可以,但是你这个建议不见得有实质性.而且我觉得你是在AD吧.
我的看法:
不是每个人都管"老公"叫"丈夫"!知道是什么意思吧!
就是说这些东西都要靠自己灵活应用了.

还有,如果你真的要火车头实现这一功能,你想想单单分析这些字段的数据有多大.中国汉字多少?6W多,词语呢?你能统计到吗?就算统计到了.你放到一个数据库去.一个个搭配成词语.试试吧.

第三.你自己写规则这么累.让火车头的开发人员做这些事,你不觉得难受么?而且还不定吃力不讨好,如何满足火车头迷?~~~

多了.慢慢想
发表于 2008-7-4 23:28:10 | 显示全部楼层
哦...还有繁体字...
发表于 2008-7-5 08:10:35 | 显示全部楼层
把广告全部去掉,你的这个标准版是有这个功能的。词库一样是需要自己添加的
 楼主| 发表于 2008-7-5 17:00:18 | 显示全部楼层
不是说让火车头开放人员来开发词库  
而是在那里有个导入到处功能
发表于 2008-7-5 19:12:16 | 显示全部楼层
不错的想法
发表于 2008-7-26 18:43:49 | 显示全部楼层
支持新版出来噶
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-20 16:57

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表