火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 12102|回复: 16

关于火车新版2.0的10条建议!

[复制链接]
发表于 2006-5-13 18:50:14 | 显示全部楼层 |阅读模式
火车的采集器在同类产品中,功能已算不错的了,而且是免费的,喜欢的朋友也很多。近闻火车要出2.0版,更加敬佩火车啦!当然如果产品做得好,自然收费也不是问题,只要价格合理就行。在此本着热爱火车的精神,希望在2.0版中建议增加或改进以下10点:

1.避免重复采集。可以增加一个历史记录的数据库,可在采集和导入时做判断动作。

2.采集测试。最好有正文预览,不导入数据库,用来判断目标网页的采集规则是否有效。

3.内容页的分页采集(至少二页)。不同于二级页面采集功能。现在的网页最少是三级分类,首页-分类页(列表页)-内容页。现在只能采一个列表页,一个内容页。遇到需要的信息在一个以上的内容页中时(如阿里巴巴的供求及公司库在二个内容页上),则没法采集。其网址采集最好使用标签。

4.采集规则导入导出。这个用处显于易见。

5.入库采集。这是很多人期待的一个功能,呵呵。

6.设定丢弃规则。在采集一条记录时,如果出现网址连接错误,在连接次数或时间超过则丢弃,自动转入下一条记录。

7.计划任务。这个在动易2006中有。对时效性强的信息比较方便。

8.数据导出。增加一个可导出到AC库中的连接,SQL还是AC可以自己选择。毕竟现在用AC库的不在少数。

9.线程自杀。在开启最高线程时,根据网络的状况,自动自杀适应最佳连接,最好设定推荐值。

10.支持不同分辨率的IE。现在的好象在1024*768支持较好,在800*600时不能自适应。

个人认为做到上面几点,收费也不成问题,呵呵。当然纯属个人意见,可愿要求过荷,火车见谅!

评分

1

查看全部评分

发表于 2006-5-15 08:56:20 | 显示全部楼层
您的建议也是非常中肯,除第二点没有规划好外其他的都基本能在2.0中实现
谢谢您的关注和支持
发表于 2006-5-15 12:21:25 | 显示全部楼层
建议不错,特别是入库,其实采集器本身可以不考虑前台如何应用,只是采集信息入库,希望支持入库到SQL和ACCESS.

现在的采集概念只涉及到文章,如果从信息数据库的角度去思考应该可以更专业.

比如一条电脑产品的参数信息,就多达几十项,如果可以作到分别入库到定义的数据字段,在以后对数据库的实际加工应用更广泛(比如根据需要做WEB内容的应用开发提供内容资源),而不仅仅是文章采集和重复发布,也不局限于现在已有的CMS产品提供采集,而是为更广泛的B/S、C/S架构的应用开发做数据库内容的支持.

楼主的建议很用心:)
 楼主| 发表于 2006-5-15 17:13:39 | 显示全部楼层
原帖由 火车头 于 2006-5-15 08:56 发表
您的建议也是非常中肯,除第二点没有规划好外其他的都基本能在2.0中实现
谢谢您的关注和支持


火车mm,辛苦了,期待ing...
 楼主| 发表于 2006-5-15 17:15:40 | 显示全部楼层
原帖由 油漆 于 2006-5-15 12:21 发表
建议不错,特别是入库,其实采集器本身可以不考虑前台如何应用,只是采集信息入库,希望支持入库到SQL和ACCESS.

现在的采集概念只涉及到文章,如果从信息数据库的角度去思考应该可以更专业.

比如 ...



明天会更好...
发表于 2006-5-22 11:39:23 | 显示全部楼层
好贴顶一个。期待中。
发表于 2006-5-22 16:10:43 | 显示全部楼层
顶一个。
发表于 2006-6-2 12:38:44 | 显示全部楼层
强帖
发表于 2006-6-3 22:49:24 | 显示全部楼层
原帖由 sunway888 于 2006-5-15 17:13 发表


火车mm,辛苦了,期待ing...


火车MM????火车是MM么????????
发表于 2006-6-5 19:58:39 | 显示全部楼层
不错,大力支持!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-3-31 02:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表