狂家三少 发表于 2009-12-30 19:22:31

应该更注重于论坛方面的采集和发布

特别是发布到论坛的

因为现在的CMS都有带采集程序

但论坛都是没带采集的,所以更应该注重这方面

cole 发表于 2009-12-31 23:26:46

用加密狗授权我个人是很支持的。

虽然采集量不是特别大,但是加硬盘或者换硬盘,换硬件,授权就不能用了,的确就是个大问题,用加密狗,虽然购买麻烦点,但日后可方便多了。

天机小子 发表于 2010-1-1 10:08:32

搞列表页标签编辑!功能哦

sesxc 发表于 2010-1-1 11:41:29

CSV导出要完善阿,现在这功能太不好用了.

寒夜一只烟 发表于 2010-1-1 14:37:42

火车头越开发越很强大了,开发人员辛苦了。新年顺利

huangyiqiu 发表于 2010-1-2 09:51:33

把翻译功能加强一下,这个是重要的一个功能啊

huangfanzhen 发表于 2010-1-2 11:10:02

1、速度
标签匹配过程,循环匹配过程,分页采集,附件下载,外部程序接口都大量减缓了速度,使得海量数据采集变得不可能
2、性能
频繁的I/O读写,内存占用不释放,CPU线程管理,火车头功能越复杂,性能越差。windows如果死了,就是没有领悟到操作系统的核心是简单、快速,而绝非漂亮;火车头的优点应该在于其通用、快速
3、分布
海量的数据采集 需要服务器端,需要有任务管理中心来管理所有火车头的分布采集,需要统一管理任务规则,需要统一存储的数据库
4、开放
火车头有很多优点,但不可能能实现所有人的要求,火车头需要开放,把核心的代码和程序写好保护好,外围的部分肯定应该让大家共同参与,方案多了,自然就无可匹敌
5、定位
火车头的专业版 个人版都定位不错,定位在个人使用者,但是标准版和企业版让我们非常失望,如果火车头只看好低端市场,那么火车头肯定长不大。因为草根毫无转移成本。

火车头的朋友,忠实的伙伴 huangfanzhen

huangfanzhen 发表于 2010-1-2 12:08:47

?我发的帖子呢? 怎么找不到了?白写了?

benls 发表于 2010-1-2 19:37:22

发现目前的2009Sp4版本,我的Windows Server2008 RC2系统不能使用,希望新版能支持这个系统,我们早已用惯这类系统了,而且换系统也很麻烦,希望新版能考虑一下我们新手们的意见,谢谢!

chenjau 发表于 2010-1-2 22:17:50

本帖最后由 chenjau 于 2010-1-2 22:21 编辑

俺建议标签可以使用 多个开始字符串,结束字符串 .
比如一个栏目里某一些文章的内容是 <----开始正文----->...............<----结束正文----->
另一些文章内容是位于:<----2222222----->...............<----2222222----->
那么由于栏目内文章分布并不规律.针对这个栏目的采集就不好处理.

如果可以填写双套开始结束字符串甚至多套,使用起来估计就非常灵活.谢谢
页: 1 2 3 4 5 6 [7] 8 9
查看完整版本: 说说您心目中的火车采集器2010