17 12
发新话题
打印

关于火车新版2.0的10条建议!

关于火车新版2.0的10条建议!

火车的采集器在同类产品中,功能已算不错的了,而且是免费的,喜欢的朋友也很多。近闻火车要出2.0版,更加敬佩火车啦!当然如果产品做得好,自然收费也不是问题,只要价格合理就行。在此本着热爱火车的精神,希望在2.0版中建议增加或改进以下10点:

1.避免重复采集。可以增加一个历史记录的数据库,可在采集和导入时做判断动作。

2.采集测试。最好有正文预览,不导入数据库,用来判断目标网页的采集规则是否有效。

3.内容页的分页采集(至少二页)。不同于二级页面采集功能。现在的网页最少是三级分类,首页-分类页(列表页)-内容页。现在只能采一个列表页,一个内容页。遇到需要的信息在一个以上的内容页中时(如阿里巴巴的供求及公司库在二个内容页上),则没法采集。其网址采集最好使用标签。

4.采集规则导入导出。这个用处显于易见。

5.入库采集。这是很多人期待的一个功能,呵呵。

6.设定丢弃规则。在采集一条记录时,如果出现网址连接错误,在连接次数或时间超过则丢弃,自动转入下一条记录。

7.计划任务。这个在动易2006中有。对时效性强的信息比较方便。

8.数据导出。增加一个可导出到AC库中的连接,SQL还是AC可以自己选择。毕竟现在用AC库的不在少数。

9.线程自杀。在开启最高线程时,根据网络的状况,自动自杀适应最佳连接,最好设定推荐值。

10.支持不同分辨率的IE。现在的好象在1024*768支持较好,在800*600时不能自适应。

个人认为做到上面几点,收费也不成问题,呵呵。当然纯属个人意见,可愿要求过荷,火车见谅!
本帖最近评分记录
  • locoy +5 我很赞同 2006-5-14 13:18

TOP

您的建议也是非常中肯,除第二点没有规划好外其他的都基本能在2.0中实现
谢谢您的关注和支持

TOP

建议不错,特别是入库,其实采集器本身可以不考虑前台如何应用,只是采集信息入库,希望支持入库到SQL和ACCESS.

现在的采集概念只涉及到文章,如果从信息数据库的角度去思考应该可以更专业.

比如一条电脑产品的参数信息,就多达几十项,如果可以作到分别入库到定义的数据字段,在以后对数据库的实际加工应用更广泛(比如根据需要做WEB内容的应用开发提供内容资源),而不仅仅是文章采集和重复发布,也不局限于现在已有的CMS产品提供采集,而是为更广泛的B/S、C/S架构的应用开发做数据库内容的支持.

楼主的建议很用心:)

TOP

引用:
原帖由 火车头 于 2006-5-15 08:56 发表
您的建议也是非常中肯,除第二点没有规划好外其他的都基本能在2.0中实现
谢谢您的关注和支持
火车mm,辛苦了,期待ing...

TOP

引用:
原帖由 油漆 于 2006-5-15 12:21 发表
建议不错,特别是入库,其实采集器本身可以不考虑前台如何应用,只是采集信息入库,希望支持入库到SQL和ACCESS.

现在的采集概念只涉及到文章,如果从信息数据库的角度去思考应该可以更专业.

比如 ...
明天会更好...

TOP

好贴顶一个。期待中。

TOP

顶一个。

TOP

强帖
车旅联盟论坛:http://www.lzoutdoor.net

TOP

引用:
原帖由 sunway888 于 2006-5-15 17:13 发表


火车mm,辛苦了,期待ing...
火车MM????火车是MM么????????

TOP

不错,大力支持!

TOP

 17 12
发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.422485 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-22 20:47 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档