火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6029|回复: 8

新手请教,采集的时候总出错,最后存到软件数据库的文件可否导出?

[复制链接]
发表于 2006-11-14 02:55:47 | 显示全部楼层 |阅读模式
新手请教,采集的时候总出错,最后存到软件数据库的文件可否导出?

程序运行中总是会自己卡死,
不知道是不是因为我机器性能和网络情况的原因。
有没有办法限制一下运行时消耗的资源,总卡死,有些受不了。
 楼主| 发表于 2006-11-14 03:18:09 | 显示全部楼层
http://eladies.sina.com.cn/jkzc/sex/index.html

这个页面该怎么采呀,实在弄不懂,请教高手
发表于 2006-11-14 08:35:03 | 显示全部楼层
你上边这个页面很好采集哦  ^_^

用自定义采集区域来采集网址
开始部分用:<input type=submit name=enter value="搜索"></td>
结束部分用:“函数名称:分页跳转”
必须包含:eladies.sina.com.cn/x/

这样应该就可以了  ^_^
 楼主| 发表于 2006-11-14 13:19:12 | 显示全部楼层
谢谢 天毅  兄的回答,不过我按你教的试了,按1级深度测试,找到1个1级目录和2个0级页面。然后我设置成2级深度测试出一大堆网址,几乎把整个新浪网都扫描了一遍。现在还没有结束呢。

另外,我不明白,为什么要设开始部分  开始部分用:<input type=submit name=enter value="搜索"></td>

在上边这部分到采集标题之间,有好大一堆代码呀!!!为什么不从标题前边开始采集呢???

重新采集的时候程序又出错了。唉,,怎么总会这样呢,你们也遇到过这样的问题吗?

[ 本帖最后由 ok123zyz 于 2006-11-14 13:23 编辑 ]
 楼主| 发表于 2006-11-14 13:30:20 | 显示全部楼层
按天毅兄的方法,把必须包含:eladies.sina.com.cn/x/
写到文章列表页面地址必须包含项里边,,测试出来59个网址。但好像没有我要采集的目标页面,这是怎么回事???
发表于 2006-11-14 15:47:23 | 显示全部楼层
目标地址重复,换个地址
 楼主| 发表于 2006-11-15 14:45:20 | 显示全部楼层

回复 #6 二亩一 的帖子

想请教一下,什么叫“目标地址重复”,换个地址,换哪个地址。请详细些,偶是新人,看不太懂。
发表于 2006-11-15 17:31:37 | 显示全部楼层
原帖由 ok123zyz 于 2006-11-14 02:55 发表
新手请教,采集的时候总出错,最后存到软件数据库的文件可否导出?

程序运行中总是会自己卡死,
不知道是不是因为我机器性能和网络情况的原因。
有没有办法限制一下运行时消耗的资源,总卡死,有些受不了。

可以导出
发表于 2006-11-18 20:56:45 | 显示全部楼层
机器的好坏在火车3.0这里很关键的,你采的越多,电脑就越卡,内存CPU都占用越多。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 18:51

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表