发新话题
打印

[2008版] 火车头经验谈,多数据多个任务一起采,比一个任务采集快!

本主题由 rq204 于 2008-8-18 09:24 移动

火车头经验谈,多数据多个任务一起采,比一个任务采集快!

我测试过N次,如果你要采集的对象数据有N万条,一个任务采集会很慢,我的火车头还采死过两次,都必须要重新再次采集.
如果分成N个任务,每个任务只采集他的1/10或者1/20之一,这样明显速度会提高很多.
不信大家试试.
因为每个任务是针对一个数据库,数据太大,操作起来火车头会很慢,我的10万数据发了都已经采了三天了,采死两次,后面一次我认真看到起采,他是越采越慢.
发布也是,明显比数据小的发得慢.

TOP

是这个道理,不过很少有人采集这么多数据的。。
国外空间 30元 5g/年   

TOP

数据太少我感觉基本上都不需要用火车头这种软件就可以解决了!

TOP

采集的时候,列表地址不要设置太多,如果真有太多太多网址,建议分成几个站点,注意,是站点。
拷贝到不同的站点下,再设置每个任务的列表地址,这样可以有效避免在排除重复地址时的冗长查询。
火车采集器商业版 咨询、购买、售后支持等 :
火车采集器2008版系列教程正在陆续发布中 :  点击观看
提供高难度采集技术支持,完美实现全站转移,多栏目自动更新
火车采集器采集规则定制:[50元/条,质量保证]
火车采集器发布模块定制:[80元/条,质量保证]
火车采集器程序接口定制:[按程序难度议价,200起]
织梦图片集自动发布模块:[100元/个,自动分析图片代码、远程下载图片]
支持支付宝淘宝安全交易:Q Q: 130775 Mail:vu520@163.com ->查看更多联系方式

TOP

学习了~

TOP

又学到了一招,学习中
    承接规则,价格实惠  
   
有意可到我的淘宝店铺里看看。
为提高信誉,有做低价规则和低价QQ远程帮助或者其它能解决你问题的帮助
QQ:378764705        本QQ不接受聊天
淘宝店址:http://shop36269944.taobao.com/  
用支付宝付款,完全可放心

TOP

呵呵   我一直就这么做的.

TOP

TOP

经验谈

TOP

原来这样啊,呵呵,还本想用一条规则搞定整个站呢,呵呵,看来这样省了做规则的时间,但采集时间增加了,呵呵,

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.494599 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-24 00:43 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档