火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3706|回复: 9

【高手请进】火车采集器采集3000万个网页要多长时间?

[复制链接]
发表于 2008-10-8 16:22:56 | 显示全部楼层 |阅读模式
如题!
火车采集器采集3000万个网页要多长时间?

在线等、、、

[ 本帖最后由 在路上 于 2008-10-8 16:26 编辑 ]
 楼主| 发表于 2008-10-8 16:29:58 | 显示全部楼层
难道这里没高手吗?
 楼主| 发表于 2008-10-8 16:33:14 | 显示全部楼层
没人回?自己顶!!!!!!!!!!!!!!
发表于 2008-10-8 16:41:36 | 显示全部楼层
一:跟您的互联网速度有关
二:跟目标站访问速度有关
三:跟目标站页面结构有关
四:跟采集规则的编写有关
五:跟你的计算机配置有关

您可以根据1条数据/秒的速率来估计
发表于 2008-10-8 16:47:35 | 显示全部楼层
在我的机器上采集分秒一个。发布一秒三个
 楼主| 发表于 2008-10-8 16:55:07 | 显示全部楼层
我的情况是:
一:中国电信ADSL 速率:4Mbps;
二:目标站是大站,类似163.com,qq.com;
三:页面结构比较标准;
四:不采集网址,网址直接提供,第一页即为目标页;
五:电脑是奔腾D双核1.8G,内存1G,硬盘120G;

能帮我估算一个大概吗?

1条数据/秒,实在是太慢了!!!这样一天才8万条数据。3000万的话,哇,要1年。我的妈呀!
发表于 2008-10-8 16:57:08 | 显示全部楼层
楼主,你好牛啊,这么漫长的你都来采集啊???真牛,如果真的要采集那么多的话就不是一台电脑能搞定的了
 楼主| 发表于 2008-10-8 17:00:08 | 显示全部楼层
我就在想如何能缩短时间啊!!!!!!

假如页面大小只有2-3KB呢?
 楼主| 发表于 2008-10-8 17:44:20 | 显示全部楼层
火车一般是针对多少数据量级的网页采集啊?
 楼主| 发表于 2008-10-8 17:46:19 | 显示全部楼层
我的情况是:
一:中国电信ADSL 速率:4Mbps;
二:目标站是大站,类似163.com,qq.com;
三:页面结构比较标准;
四:不采集网址,网址直接提供,第一页即为目标页;
五:电脑是奔腾D双核1.8G,内存1G,硬盘120G;

能帮我估算一个大概吗?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-23 09:20

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表