火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5309|回复: 6

织梦系统快速采集的几大纪要-所有帖子全部共享

[复制链接]
发表于 2008-7-2 04:03:47 | 显示全部楼层 |阅读模式
本人多次采集了几大系统,发现织梦是最快的,可是如何在12小时内采集并且入库  6万以上文章 (一天内),我总结了以下几点:

1,不生成静态文章。发布时采用动态方法,即发布模块的ishtml改为0.这样不生成页面。
2,首页也不要每次更新,在dede后台,改为首页不更新。
3, 防止其他人采集,一般在防止采集设置,启用字符串混淆来防采。 “
代码如下
  1. <?php
  2. //随机字符串,请在"#,"后填上你网站的广告语或网址
  3. #start#------本行不允许更改

  4. #,itbig.net
  5. #,51dev.com
  6. #,china365.asia
  7. #,boyilun.net
  8. #,xiupin.net
  9. #,article365.net
  10. #,geekall.com
  11. #,51dev.com
  12. #,iptvforum.asia

  13. #end#--------本行不允许更改
  14. //------------------------------
  15. ?>”
复制代码


4, 数据库内容替换,把文章的栏目和文章都改为静态方式,直接替换数据库最快。
A, 表(dede_addonarticle)->body含有的字段:从-1改为1 文章就变为静态了。
B, 表(dede_arctype)含有的字段:isdefault,从-1改为1,栏目就是静态了。
C, title下把2个空格优化为1个,2次,防止标题中出现很多空格。
D,  增加隐藏信息 <span style="display:none">Free Big Center http://itbig.net</span>,可以把</div>替换成</div><span style="display:none">Free Big Center http://itbig.net</span>

5, 超级快的入库方法,就是用 mysql 数据库入库模块,如果6万,假如是 60个工程,可以在一个小时内全部入完。

电脑配置,起码奔四2.4G以上。内存至少512M,电脑年龄小于2.


帖子免费了,广告加一个,今天发布了我的第X个垃圾站点-- SEO三十六计, 地址 http://seo36.com     从此我的垃圾站点全面制作计划暂时告一段落。

[ 本帖最后由 jndx 于 2008-7-4 00:06 编辑 ]
 楼主| 发表于 2008-7-2 04:06:02 | 显示全部楼层
希望加点火车头,老大
发表于 2008-7-2 10:22:19 | 显示全部楼层
你共享给大家,就帮你加火车厢!
发表于 2008-7-2 11:16:31 | 显示全部楼层
楼住我们穷买不起
发表于 2008-7-6 16:33:21 | 显示全部楼层

直接对数据库进行操作是最快的
发表于 2008-7-7 14:19:51 | 显示全部楼层
楼主很厉害啊。。。
发表于 2011-8-4 10:02:16 | 显示全部楼层
这个 增加隐藏信息 加在那里啊?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-22 22:15

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表