|
发表于 2008-7-27 03:59:31
|
显示全部楼层
1.自动更新的"已选中任务批量保存"的,任务列表假如站点这个"根chackbox"是选中的,那么批量任务就会报错!但假如选空"根chackbox"则目录下所有的任务条目的(非采网址 采内容和发内容)chackbox都会选空,这样就要一个一个的去选前面的,批量40个任务时就会很累!用的时间长了 就觉得站点任务列表条目是两套选中模型,一种是"寿命偏长的"chackbox", 另外是临时的点击选中 前后没有关联.
2."chackbox"的选择情况能不能保存 下次启动时依旧是上次的状态,增加选中寿命.或者说自动采集的状态是保存的.
3.右击任务时有几率会报一个错.
3.标签中的"随机抽取信息",如果有10条条目 他随机的概率效果较好 但是数百条条目时他就不好好工作,成排的10多个连续的都是一样的,这个位置的随机出现的概率算法不好.
同时建议整个位置使用数据库或者一个接口,能通过数据库来倒进来抽取信息来源.
4.发布模块随机值获取上似乎支持不太好,也不支持正则表达.
5.整个软件数据假如用SQLITE做应该速度稳定性都要比access好一些.
6.呵呵,任务成功后,那个声音是难听,在我机器上还有暴音,建议更换,添加声音开关设置.
7.觉得企业版应该不仅仅卖更多的license,更应该把火车做成一个强大的爬虫,支持更多的API或者设置数据的接口,更加强大的命令行级别的自定义自动任务(包括自动任务的内容也外接出去).而火车企业版更应该是一个后台中的软件级爬虫服务器.
8.希望火车越来越好,甚至某天都有了LINUX企业版.
[ 本帖最后由 yoyicue 于 2008-7-27 22:09 编辑 ] |
评分
-
1
查看全部评分
-
|