|
本人多次采集了几大系统,发现织梦是最快的,可是如何在12小时内采集并且入库 6万以上文章 (一天内),我总结了以下几点:
1,不生成静态文章。发布时采用动态方法,即发布模块的ishtml改为0.这样不生成页面。
2,首页也不要每次更新,在dede后台,改为首页不更新。
3, 防止其他人采集,一般在防止采集设置,启用字符串混淆来防采。 “
代码如下- <?php
- //随机字符串,请在"#,"后填上你网站的广告语或网址
- #start#------本行不允许更改
- #,itbig.net
- #,51dev.com
- #,china365.asia
- #,boyilun.net
- #,xiupin.net
- #,article365.net
- #,geekall.com
- #,51dev.com
- #,iptvforum.asia
- #end#--------本行不允许更改
- //------------------------------
- ?>”
复制代码 。
4, 数据库内容替换,把文章的栏目和文章都改为静态方式,直接替换数据库最快。
A, 表(dede_addonarticle)->body含有的字段:从-1改为1 文章就变为静态了。
B, 表(dede_arctype)含有的字段:isdefault,从-1改为1,栏目就是静态了。
C, title下把2个空格优化为1个,2次,防止标题中出现很多空格。
D, 增加隐藏信息 <span style="display:none">Free Big Center http://itbig.net</span>,可以把</div>替换成</div><span style="display:none">Free Big Center http://itbig.net</span>
5, 超级快的入库方法,就是用 mysql 数据库入库模块,如果6万,假如是 60个工程,可以在一个小时内全部入完。
电脑配置,起码奔四2.4G以上。内存至少512M,电脑年龄小于2.
[ 本帖最后由 jndx 于 2008-7-4 00:06 编辑 ] |
|