火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3891|回复: 8

大量采集时开始很慢,vip版会快一些吗?

[复制链接]
发表于 2009-1-23 16:13:25 | 显示全部楼层 |阅读模式
比如说建一个30或者50万链接的采集,点任务开始之后就要等上几个小时才真正开始,这段时间就一直不能点击或其他任何动作。
猜测这段时间是不是往access数据库里写链接呢?如果是vip版的sqlite,开始的这段时间会不会快很多?
发表于 2009-1-23 16:28:23 | 显示全部楼层
不知道,我刚刚买的,还没测试呢
发表于 2009-1-23 17:37:42 | 显示全部楼层
你可以每次采集一部分页面比如300页每次只采集50页。
 楼主| 发表于 2009-1-23 18:09:09 | 显示全部楼层
楼上两位都是个人版的,管理员不是测试过sqlite生成十万级的链接只需要很少的时间吗?
因为采集的东西都很小,但是量都是很多的,20w、50w、80w这种比较常见的数量级,挂上几天不用管。如果分成太小份的就比较累了。

做一个猜测,如果开始这几个小时的假死是因为写access的关系,那么自己写程序操作SpiderResult.mdb,只要保证什么true、false、pageurl的值都正确,标签也对应,确保是初始状态,然后再开始任务就可以直接进行采集了吧??
发表于 2009-1-23 19:56:21 | 显示全部楼层
有看头,回复支持下.
发表于 2009-1-23 20:34:13 | 显示全部楼层
采集速度一样,但是写入和读取数据库的速度会快一些
发表于 2009-1-23 22:43:08 | 显示全部楼层
写入速度上来看,ViP版的Sqlite确实要快数倍乃至数十倍。
发表于 2009-1-23 23:04:14 | 显示全部楼层
没遇到楼主的现象。。。。。。。。。
发表于 2009-1-29 09:31:04 | 显示全部楼层
楼主说得这个问题还是很重要的。
如果是需要获取cookier的网站,是无法一下子采集很多数据的,设置的多了,火车开始假死机的这段时间很长,很多时候cookier就过期了,无法猜到正确的数据,只能设置一次采集少量数据,分次采集才可以。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-16 17:33

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表