火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5863|回复: 10

为啥我只采集了几千个帖子```数据库就达到了50M

[复制链接]
发表于 2008-4-28 15:05:38 | 显示全部楼层 |阅读模式
我是用3.2sp5采集的```

采集过程中有一些发表失败的```

但是最后结果是采集了3000个帖子左右

今天备份数据库的时候发现数据库竟然有50M备份要100M```晕死了```

我另外一个论坛几万的帖子(不是采集的)``也才30M的数据库啊。。。

我发布的时候是用默认的发布接口```discuz6.0的(论坛今天升级的6.1,昨天备份数据库的时候才发现数据库异常大)

大家帮忙看看是怎么回事?

[ 本帖最后由 hhechj 于 2008-4-28 18:18 编辑 ]
发表于 2008-4-28 15:08:39 | 显示全部楼层
具体问题得具体分析,问题最好再详细点大家好出主意
头像被屏蔽
发表于 2008-4-28 15:12:44 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2008-4-28 15:50:33 | 显示全部楼层
2楼:
我第一次用火车头
不清楚啥具体问题。。。


3楼:
垃圾代码太多的话怎么办呢?
发表于 2008-4-28 16:08:00 | 显示全部楼层
垃圾代码多的话在设定采集规则时候 尽量屏蔽不需要的代码
 楼主| 发表于 2008-4-28 16:13:40 | 显示全部楼层
噢```

采集规则我设置好久才可以的```

新手比较不懂```

那现在论坛的那些数据怎么办?

要不这么大的论坛数据库。。。
发表于 2008-4-28 17:06:09 | 显示全部楼层
没有用的代码.近量排除掉. 要不几万贴子.数据库会大很多
 楼主| 发表于 2008-4-28 17:13:08 | 显示全部楼层
那就是说现在采集的数据全部删除?

然后重新采集嘛???
头像被屏蔽
发表于 2008-4-28 17:38:36 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2008-4-28 17:58:08 | 显示全部楼层
但是论坛的帖子看起来都很正常啊。。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-18 15:13

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表