火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5715|回复: 9

火车头经验谈,多数据多个任务一起采,比一个任务采集快!

[复制链接]
发表于 2008-8-17 18:34:46 | 显示全部楼层 |阅读模式
我测试过N次,如果你要采集的对象数据有N万条,一个任务采集会很慢,我的火车头还采死过两次,都必须要重新再次采集.
如果分成N个任务,每个任务只采集他的1/10或者1/20之一,这样明显速度会提高很多.
不信大家试试.
因为每个任务是针对一个数据库,数据太大,操作起来火车头会很慢,我的10万数据发了都已经采了三天了,采死两次,后面一次我认真看到起采,他是越采越慢.
发布也是,明显比数据小的发得慢.
发表于 2008-8-17 18:37:29 | 显示全部楼层
是这个道理,不过很少有人采集这么多数据的。。
 楼主| 发表于 2008-8-17 20:32:11 | 显示全部楼层
数据太少我感觉基本上都不需要用火车头这种软件就可以解决了!
发表于 2008-8-17 21:40:45 | 显示全部楼层
采集的时候,列表地址不要设置太多,如果真有太多太多网址,建议分成几个站点,注意,是站点。
拷贝到不同的站点下,再设置每个任务的列表地址,这样可以有效避免在排除重复地址时的冗长查询。
发表于 2008-8-18 18:39:06 | 显示全部楼层
学习了~
发表于 2008-8-18 19:46:03 | 显示全部楼层
又学到了一招,学习中
发表于 2008-8-18 19:50:47 | 显示全部楼层
呵呵   我一直就这么做的.
发表于 2008-8-19 11:26:08 | 显示全部楼层
发表于 2008-8-19 13:26:15 | 显示全部楼层
经验谈
发表于 2008-8-20 11:09:03 | 显示全部楼层
原来这样啊,呵呵,还本想用一条规则搞定整个站呢,呵呵,看来这样省了做规则的时间,但采集时间增加了,呵呵,
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-21 06:54

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表