sunway888 发表于 2006-5-13 18:50:14

关于火车新版2.0的10条建议!

火车的采集器在同类产品中,功能已算不错的了,而且是免费的,喜欢的朋友也很多。近闻火车要出2.0版,更加敬佩火车啦!当然如果产品做得好,自然收费也不是问题,只要价格合理就行。在此本着热爱火车的精神,希望在2.0版中建议增加或改进以下10点:

1.避免重复采集。可以增加一个历史记录的数据库,可在采集和导入时做判断动作。

2.采集测试。最好有正文预览,不导入数据库,用来判断目标网页的采集规则是否有效。

3.内容页的分页采集(至少二页)。不同于二级页面采集功能。现在的网页最少是三级分类,首页-分类页(列表页)-内容页。现在只能采一个列表页,一个内容页。遇到需要的信息在一个以上的内容页中时(如阿里巴巴的供求及公司库在二个内容页上),则没法采集。其网址采集最好使用标签。

4.采集规则导入导出。这个用处显于易见。

5.入库采集。这是很多人期待的一个功能,呵呵。

6.设定丢弃规则。在采集一条记录时,如果出现网址连接错误,在连接次数或时间超过则丢弃,自动转入下一条记录。

7.计划任务。这个在动易2006中有。对时效性强的信息比较方便。

8.数据导出。增加一个可导出到AC库中的连接,SQL还是AC可以自己选择。毕竟现在用AC库的不在少数。

9.线程自杀。在开启最高线程时,根据网络的状况,自动自杀适应最佳连接,最好设定推荐值。

10.支持不同分辨率的IE。现在的好象在1024*768支持较好,在800*600时不能自适应。

个人认为做到上面几点,收费也不成问题,呵呵。当然纯属个人意见,可愿要求过荷,火车见谅!

火车头 发表于 2006-5-15 08:56:20

您的建议也是非常中肯,除第二点没有规划好外其他的都基本能在2.0中实现
谢谢您的关注和支持

油漆 发表于 2006-5-15 12:21:25

建议不错,特别是入库,其实采集器本身可以不考虑前台如何应用,只是采集信息入库,希望支持入库到SQL和ACCESS.

现在的采集概念只涉及到文章,如果从信息数据库的角度去思考应该可以更专业.

比如一条电脑产品的参数信息,就多达几十项,如果可以作到分别入库到定义的数据字段,在以后对数据库的实际加工应用更广泛(比如根据需要做WEB内容的应用开发提供内容资源),而不仅仅是文章采集和重复发布,也不局限于现在已有的CMS产品提供采集,而是为更广泛的B/S、C/S架构的应用开发做数据库内容的支持.

楼主的建议很用心:)

sunway888 发表于 2006-5-15 17:13:39

原帖由 火车头 于 2006-5-15 08:56 发表
您的建议也是非常中肯,除第二点没有规划好外其他的都基本能在2.0中实现
谢谢您的关注和支持

火车mm,辛苦了,期待ing...

sunway888 发表于 2006-5-15 17:15:40

原帖由 油漆 于 2006-5-15 12:21 发表
建议不错,特别是入库,其实采集器本身可以不考虑前台如何应用,只是采集信息入库,希望支持入库到SQL和ACCESS.

现在的采集概念只涉及到文章,如果从信息数据库的角度去思考应该可以更专业.

比如 ...


明天会更好...

baobao 发表于 2006-5-22 11:39:23

好贴顶一个。期待中。

test519 发表于 2006-5-22 16:10:43

顶一个。

fdmao 发表于 2006-6-2 12:38:44

强帖

xhwhss 发表于 2006-6-3 22:49:24

原帖由 sunway888 于 2006-5-15 17:13 发表


火车mm,辛苦了,期待ing...

火车MM????火车是MM么????????

lcw2000 发表于 2006-6-5 19:58:39

不错,大力支持!
页: [1] 2
查看完整版本: 关于火车新版2.0的10条建议!