应该更注重于论坛方面的采集和发布
特别是发布到论坛的
因为现在的CMS都有带采集程序
但论坛都是没带采集的,所以更应该注重这方面
用加密狗授权我个人是很支持的。
虽然采集量不是特别大,但是加硬盘或者换硬盘,换硬件,授权就不能用了,的确就是个大问题,用加密狗,虽然购买麻烦点,但日后可方便多了。
搞列表页标签编辑!功能哦
CSV导出要完善阿,现在这功能太不好用了.
火车头越开发越很强大了,开发人员辛苦了。新年顺利
把翻译功能加强一下,这个是重要的一个功能啊
1、速度
标签匹配过程,循环匹配过程,分页采集,附件下载,外部程序接口都大量减缓了速度,使得海量数据采集变得不可能
2、性能
频繁的I/O读写,内存占用不释放,CPU线程管理,火车头功能越复杂,性能越差。windows如果死了,就是没有领悟到操作系统的核心是简单、快速,而绝非漂亮;火车头的优点应该在于其通用、快速
3、分布
海量的数据采集 需要服务器端,需要有任务管理中心来管理所有火车头的分布采集,需要统一管理任务规则,需要统一存储的数据库
4、开放
火车头有很多优点,但不可能能实现所有人的要求,火车头需要开放,把核心的代码和程序写好保护好,外围的部分肯定应该让大家共同参与,方案多了,自然就无可匹敌
5、定位
火车头的专业版 个人版都定位不错,定位在个人使用者,但是标准版和企业版让我们非常失望,如果火车头只看好低端市场,那么火车头肯定长不大。因为草根毫无转移成本。
火车头的朋友,忠实的伙伴 huangfanzhen
?我发的帖子呢? 怎么找不到了?白写了?
发现目前的2009Sp4版本,我的Windows Server2008 RC2系统不能使用,希望新版能支持这个系统,我们早已用惯这类系统了,而且换系统也很麻烦,希望新版能考虑一下我们新手们的意见,谢谢!
本帖最后由 chenjau 于 2010-1-2 22:21 编辑
俺建议标签可以使用 多个开始字符串,结束字符串 .
比如一个栏目里某一些文章的内容是 <----开始正文----->...............<----结束正文----->
另一些文章内容是位于:<----2222222----->...............<----2222222----->
那么由于栏目内文章分布并不规律.针对这个栏目的采集就不好处理.
如果可以填写双套开始结束字符串甚至多套,使用起来估计就非常灵活.谢谢