火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5098|回复: 2

对火车采集的几点建议!

[复制链接]
发表于 2006-3-16 10:29:55 | 显示全部楼层 |阅读模式
1.网址采集时最好是使用分页通配符。(虽然有(*)生成连续网址。但经测试,如果生成的网址中有些页面目标站删除后。火车采集就停在那里了。这样不方便)
2.最好配一个AC数据库用于记忆已经采集过的网址,这样避免重复采集!
3.登陆设置是否考虑更加优化!
4.(与第1相关)最好能使用自定义规则下一页的方式。以避免有的分页规则是按篇幅分页的。比如pageid=25这一页就有25个主题,下页就是pageID=50
5.导出采集规则希望能加上!

[ 本帖最后由 森林 于 2006-3-20 13:58 编辑 ]
发表于 2006-3-19 23:00:47 | 显示全部楼层
同意第2点
发表于 2006-3-21 09:55:56 | 显示全部楼层
1,4这样的问提我遇到过,看能不能改进成 在一定时间内不能采集就跳过采集下一个
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 02:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表