|
|
最近在认坛看到有些站长说自己网站上的内容数据已经很多了,可是搜索引擎却收录不多,比较郁闷。
我自己之前也用过很多的CMS来做手机网站,内容绝大部分是采集回来的。采集对新站来说,绝对是个好东西,特别是人力比较少的站点。我的那些网站用了采集后,不到一星期就有上万条数据了。看到满满的内容,心里就一个字,爽!
但去百度查收录情况的时候,大失所望~收录得很少,就几百条,汗。。。难怪流量总上不去。当时我认为可能是时间问题。毕竟是新站嘛,搜索引擎的爬虫也需要工作时间的吧!之后差不多过了两个星期左右,我再查,虽然收录的数量上升了,但不理想。难道我的程序有问题?当时的第一反应。不过,不太可能,因为用同样的CMS的大有人在,要是有问题,早就有人提出来了!
无意中,我在收录结果中看到了点东西:在我印象中排在前面的内容多数是我自己点过和采回来后修改过的。难道引擎只会探测到被人浏览过的内容?或者说被浏览过的内容会更快的收录吗?带着这样的疑问,我想了一下,如果爬虫是跟着流量走的话,就很有可能了。越多人看,就收录得越快。浏览行业实际就是提示爬虫来收录的。
有了以上的想法,我叫一个好朋友写了个小脚本,在里边添加了N条的内容地址,调动IE自动地浏览这N的内容。就这样持续了几天,我再查收录情况。果然上升了几倍,比较两个星期收录的还多几倍,呵。。从搜索引擎过来的流量也多了很多。
总结:采集后,爬虫基本上不知道你采集的,因为都是在后台完整的。采集就有点象走后门的感觉,静悄悄的,很难被人发现。所以建议站长们,采集内容后,自己浏览一遍,也方便检查有没有错误嘛:)
有朋友说,我这样做是作弊,在刷PV值。当然,我不否认他说的是正确的。不过,我想,如果我不是用脚本实现的,而且人工去浏览内容,算不算作弊呢?
(以上所述只是本人亲身的经历,仅供参考)
来源:站友网
尊重原创,如需转载,请注名出处 |
评分
-
1
查看全部评分
-
|