火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: jingsu2000

【求助】3.1采集的时候,服务器CPU直接到了100%

[复制链接]
发表于 2007-7-26 18:00:21 | 显示全部楼层
不要在线发布了,直接入库吧。
我就是这样,CPU占用主要是IIS或者Apache。

直接入库的话,CPU占用就会很小。
 楼主| 发表于 2007-7-26 18:51:52 | 显示全部楼层
原帖由 天毅 于 2007-7-26 01:49 发表
这个模块是设置为待审核稿件的
这样就不会生成了 采集发布之后自己到后台批量审核一遍就好~
先用用看看效果再说

刚才去睡觉了  睡不着 又起来看了看

现在换了你改的模板,是生成动态了

但问题还是没有解决,采集了两篇,然后虚拟主机就当了

DEDE的采集也是生成动态,也是采集完后在审核

但我用DEDE采集就不会当机

火车头的采集和DEDE自带的有什么区别?
 楼主| 发表于 2007-7-26 18:53:31 | 显示全部楼层
原帖由 天蝎网子 于 2007-7-26 18:00 发表
不要在线发布了,直接入库吧。
我就是这样,CPU占用主要是IIS或者Apache。

直接入库的话,CPU占用就会很小。

开始也想过这样的

我买的空间和数据库是一起买的

数据库不能外部连接

只能在网站调用

火车连接不了
发表于 2007-7-27 00:49:04 | 显示全部楼层
火车头的采集和DEDE自带的有什么区别:
您自己对比功能 速度 效率方面就知道差别了

至于还是当机,我建议您在本地搭建一个php环境来采集
直接入库
然后备份数据 上传网上 不也一样的效果吗?
 楼主| 发表于 2007-7-27 09:35:22 | 显示全部楼层
原帖由 天毅 于 2007-7-27 00:49 发表
火车头的采集和DEDE自带的有什么区别:
您自己对比功能 速度 效率方面就知道差别了

至于还是当机,我建议您在本地搭建一个php环境来采集
直接入库
然后备份数据 上传网上 不也一样的效果吗?

本来也是这样想的,因为自己的电脑PHP+MYSQL架了的,买空间之前就是把DEDE放在自己电脑上研究的

也想的是先采集,在我电脑的DEDE上发布,然后在备份数据库

但是一想,这样做不能长久

备份数据库的时候DEDE里面都是备份单个数据表

每次更新了新的文章,都要将存放文章的那个数据表备份,也就是将所有的文章都备份了一遍

等以后文章多了,这样备份一次,也得花好长时间啊
 楼主| 发表于 2007-7-27 09:50:16 | 显示全部楼层
原帖由 天毅 于 2007-7-27 00:49 发表
火车头的采集和DEDE自带的有什么区别:
您自己对比功能 速度 效率方面就知道差别了



还有关于差别,我能不能降低火车头的采集速度和效率,我现在的要求就是不当机
 楼主| 发表于 2007-7-27 15:43:38 | 显示全部楼层
如果现在的版本不能通过降低火车头的采集速度和效率,让我能使用

那下一个版本能不能?希望大大们能让我安心
发表于 2007-7-27 18:41:14 | 显示全部楼层
dede的采集最好是动态浏览,不要选择下载站内图片什么资源(dede),分页也手动,这样的话,你采集的时候你的服务器才顶的住。如果你一边采集一边生成静态,再牛B的服务器也当!以上的要求修改模块即可完成,对应参数改。这样做了的话,一般是不会当机的,我连采1w还没当过。
发表于 2007-7-27 18:43:51 | 显示全部楼层
补充一点:采集的时间间隔设置成2000-3000MS,不要那么快。曾经碰到一个问我的,其实什么都对,老说不成功,掉帖子,最后一看,设置成300ms!简直就是攻击人家网站啊,再说你网速不够快就不要设置那么短。这也是一个问题。
 楼主| 发表于 2007-7-28 09:10:19 | 显示全部楼层
原帖由 xyyfx 于 2007-7-27 18:41 发表
dede的采集最好是动态浏览,不要选择下载站内图片什么资源(dede),分页也手动,这样的话,你采集的时候你的服务器才顶的住。如果你一边采集一边生成静态,再牛B的服务器也当!以上的要求修改模块即可完成,对 ...

补充一点:采集的时间间隔设置成2000-3000MS,不要那么快。曾经碰到一个问我的,其实什么都对,老说不成功,掉帖子,最后一看,设置成300ms!简直就是攻击人家网站啊,再说你网速不够快就不要设置那么短。这也是一个问题。


一。我现在用的就是天毅改的模板,不生成静态,也没有下载图片之类的资源,是纯文字的,手动分页这个我不会,这个很重要吗?请教我,我试下,谢谢

二。采集的间隔我以前设置的是2000,现在改成了3000,依然不行,关键的是,一篇文章都没采集到,就当机了,应该不关采集间隔的事吧?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-25 18:20

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表