火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3637|回复: 5

采集带来收录的问题

[复制链接]
发表于 2007-5-19 12:35:29 | 显示全部楼层 |阅读模式
最近在认坛看到有些站长说自己网站上的内容数据已经很多了,可是搜索引擎却收录不多,比较郁闷。

我自己之前也用过很多的CMS来做手机网站,内容绝大部分是采集回来的。采集对新站来说,绝对是个好东西,特别是人力比较少的站点。我的那些网站用了采集后,不到一星期就有上万条数据了。看到满满的内容,心里就一个字,爽!

但去百度查收录情况的时候,大失所望~收录得很少,就几百条,汗。。。难怪流量总上不去。当时我认为可能是时间问题。毕竟是新站嘛,搜索引擎的爬虫也需要工作时间的吧!之后差不多过了两个星期左右,我再查,虽然收录的数量上升了,但不理想。难道我的程序有问题?当时的第一反应。不过,不太可能,因为用同样的CMS的大有人在,要是有问题,早就有人提出来了!

无意中,我在收录结果中看到了点东西:在我印象中排在前面的内容多数是我自己点过和采回来后修改过的。难道引擎只会探测到被人浏览过的内容?或者说被浏览过的内容会更快的收录吗?带着这样的疑问,我想了一下,如果爬虫是跟着流量走的话,就很有可能了。越多人看,就收录得越快。浏览行业实际就是提示爬虫来收录的。

有了以上的想法,我叫一个好朋友写了个小脚本,在里边添加了N条的内容地址,调动IE自动地浏览这N的内容。就这样持续了几天,我再查收录情况。果然上升了几倍,比较两个星期收录的还多几倍,呵。。从搜索引擎过来的流量也多了很多。

总结:采集后,爬虫基本上不知道你采集的,因为都是在后台完整的。采集就有点象走后门的感觉,静悄悄的,很难被人发现。所以建议站长们,采集内容后,自己浏览一遍,也方便检查有没有错误嘛:)

有朋友说,我这样做是作弊,在刷PV值。当然,我不否认他说的是正确的。不过,我想,如果我不是用脚本实现的,而且人工去浏览内容,算不算作弊呢?

(以上所述只是本人亲身的经历,仅供参考)

来源:站友网
尊重原创,如需转载,请注名出处

评分

1

查看全部评分

发表于 2007-5-19 13:26:00 | 显示全部楼层
有点意思,顶一下
发表于 2007-5-20 15:24:40 | 显示全部楼层
受益非浅!
发表于 2007-5-22 16:48:48 | 显示全部楼层
呵呵,不错,也许有用,改天试试
发表于 2007-5-22 17:50:47 | 显示全部楼层
不可能的事,百度不可能通过IE监控你浏览了什么网页,除非百度也出品流氓插件
发表于 2007-5-22 20:14:36 | 显示全部楼层
谢谢
我说那原来是这样啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-5 19:05

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表