发新话题
打印

火车采集器2008版意见征集帖

本主题由 rq204 于 2008-7-18 09:14 设置高亮
替换能否有次数限制,随机替换
本帖最近评分记录
  • rq204 火车车厢 +1 谢谢您的提议 2008-7-28 14:18
  • rq204 活跃度 +2 谢谢您的提议 2008-7-28 14:18
[url=http://bbs.flower169.com][color=red]花花世界论坛[/color] [/url]

TOP

获取源代码、模拟查看、提交工具的建议!如图:

希望增加 “代码复制”按钮!既一点就把获取的html代码复制到粘贴板中!希望火车考虑。。。。因为这个功能虽小,但是很实用!
附件: 您所在的用户组无法下载或查看附件
本帖最近评分记录
  • rq204 火车车厢 +2 谢谢您的提议 2008-7-28 14:18
  • rq204 活跃度 +4 谢谢您的提议 2008-7-28 14:18

TOP

发布模块个人版能不能有VIP体验权。现在的模块用的人多,新浪之类很明显会改规则。

论坛很明显对发布模块这一块说的很少,制作也比较耗费时间,如果有我买套试下。

这套程序利用好了。真的SEO很不错。。谢谢

-------------------------------------------------
补充下,另外在某些自动更新的时候(例如实时采集),可以添加下文章发布成功通知。就像FOXMAIL一样。收到信,通知一声。便于检查文章。

[ 本帖最后由 qquxi 于 2008-7-25 03:16 编辑 ]
本帖最近评分记录
  • rq204 活跃度 +4 谢谢您的提议 2008-7-28 14:18
  • rq204 火车车厢 +2 谢谢您的提议 2008-7-28 14:18

TOP

希望能捕获动态Cookies~!~!
本帖最近评分记录
  • rq204 火车车厢 +1 谢谢您的提议 2008-7-28 14:18
  • rq204 活跃度 +2 谢谢您的提议 2008-7-28 14:18
Vbulletin SEO/插件/风格/产品交流. QQ群 40960306
www.92an.com

TOP

1、希望能够多用户(原来的用户名)发布
2、附件本地化直接web发布到论坛,或者入库
3、能否做成discuz等论坛的插件模式,在服务器中自动采集(跟被采集的论坛能一模一样)
本帖最近评分记录
  • rq204 火车车厢 +2 谢谢您的提议 2008-7-28 14:19
  • rq204 活跃度 +6 谢谢您的提议 2008-7-28 14:19

TOP

希望可以实时更新 官方发布的  各种论坛  CMS 一切的发布模板
省的找了一大堆都是没用的别人骗车厢的
本帖最近评分记录
  • rq204 火车车厢 +2 谢谢您的提议 2008-7-28 14:19
  • rq204 活跃度 +4 谢谢您的提议 2008-7-28 14:19

TOP

建议相同标题可设为过滤

建议相同标题可设为过滤
由于网站相互采集的现象,就会有许多相同的内容,建议相同标题可设为过滤。
本帖最近评分记录
  • rq204 火车车厢 +1 谢谢您的提议 2008-7-28 14:19
  • rq204 活跃度 +4 谢谢您的提议 2008-7-28 14:19

TOP

有些真实下载链接地址不能探测到,写规则也无法替换
例如:txtbook.com.cn的小说就不行的
希望解决下
本帖最近评分记录
  • rq204 活跃度 +2 谢谢您的提议 2008-7-28 14:20
  • rq204 火车车厢 +1 谢谢您的提议 2008-7-28 14:20

TOP

1.自动更新的"已选中任务批量保存"的,任务列表假如站点这个"根chackbox"是选中的,那么批量任务就会报错!但假如选空"根chackbox"则目录下所有的任务条目的(非采网址 采内容和发内容)chackbox都会选空,这样就要一个一个的去选前面的,批量40个任务时就会很累!用的时间长了 就觉得站点任务列表条目是两套选中模型,一种是"寿命偏长的"chackbox", 另外是临时的点击选中 前后没有关联.

2."chackbox"的选择情况能不能保存 下次启动时依旧是上次的状态,增加选中寿命.或者说自动采集的状态是保存的.

3.右击任务时有几率会报一个错.

3.标签中的"随机抽取信息",如果有10条条目 他随机的概率效果较好 但是数百条条目时他就不好好工作,成排的10多个连续的都是一样的,这个位置的随机出现的概率算法不好.
同时建议整个位置使用数据库或者一个接口,能通过数据库来倒进来抽取信息来源.

4.发布模块随机值获取上似乎支持不太好,也不支持正则表达.

5.整个软件数据假如用SQLITE做应该速度稳定性都要比access好一些.

6.呵呵,任务成功后,那个声音是难听,在我机器上还有暴音,建议更换,添加声音开关设置.

7.觉得企业版应该不仅仅卖更多的license,更应该把火车做成一个强大的爬虫,支持更多的API或者设置数据的接口,更加强大的命令行级别的自定义自动任务(包括自动任务的内容也外接出去).而火车企业版更应该是一个后台中的软件级爬虫服务器.

8.希望火车越来越好,甚至某天都有了LINUX企业版.

[ 本帖最后由 yoyicue 于 2008-7-27 22:09 编辑 ]
本帖最近评分记录
  • rq204 火车车厢 +5 谢谢您的提议 2008-7-28 14:20
  • rq204 活跃度 +10 谢谢您的提议 2008-7-28 14:20

TOP

关于采集测试 可以参考一下SS/XS-的一步一步的测试
本帖最近评分记录
  • rq204 火车车厢 +1 谢谢您的提议 2008-7-28 14:20
  • rq204 活跃度 +3 谢谢您的提议 2008-7-28 14:20

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.199541 second(s), 8 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 00:11 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档