发新话题
打印

火车采集器2008版意见征集帖

本主题由 rq204 于 2008-7-18 09:14 设置高亮
我的电脑只能用到sp1版本 其他会出错
sp1版本 采集标题的正则替换功能有问题。
本帖最近评分记录
  • rq204 火车车厢 +1 谢谢您的提议 2008-7-28 14:20
  • rq204 活跃度 +3 谢谢您的提议 2008-7-28 14:20

TOP

1.
建议“自定义固定格式的数据”-“随机抽取信息”设定出现的频率均等“自定义固定格式的数据”-“随机抽取信息”里,
一行一条内容信息出现的频率不是均等的。

希望这个“一行一条内容信息”出现的频率是均等的

比如作者标签有:火车头、孤魂、麦兜3行内容,如果发布3篇文章,就让它们都只出现一次。
可以按顺序出现,或者随机出现都可以,最重要的是让它们出现的几率都是一样的


2.
火车头的“任务自动更新”功能:设定了火车头的“任务自动更新”的时间之后,
如果关闭了这个火车头软件,重新打开的时候;原有设置的自动更新全部失效了。


3.
采集文章的时候的内容替换功能:希望在“采集内容规则”的“内容替换”里面实现 标签替换 的功能,
比如在采集的时候设置,把要采的文章内容中的所有“中国”这个词替换为“[标签:标题]"。
那么效果如下:
原文标题1:幸福
原文内容1:我是一个中国小朋友
原文标题2:快乐
原文内容2:熊猫是中国的动物


采集发布后的标题1:幸福
采集发布后的标题1:我是一个幸福小朋友 (内容中的“中国”这个词替换成[标签:标题],即替换成幸福
采集发布后的标题2:快乐
采集发布后的标题2:熊猫是快乐的动物 (内容中的“中国”这个词替换成[标签:标题],即替换成快乐

[ 本帖最后由 diligency 于 2008-7-27 14:47 编辑 ]
本帖最近评分记录
  • rq204 火车车厢 +2 谢谢您的提议 2008-7-28 14:21
  • rq204 活跃度 +5 谢谢您的提议 2008-7-28 14:21

TOP

1 标签窗口 太小了,有的时候使用正则 编辑 很不方便 ,应该 有个自适应的窗口
2  新建的采集站点,任务等其他功能要多增加 这样就减少在 本内规则下的任务 编辑了
3 火车头 外观 很土!希望得到可以更改好的皮肤。

                      火车 很好 很强大!
本帖最近评分记录
  • rq204 火车车厢 +2 谢谢您的建议 2008-7-28 14:25
  • rq204 活跃度 +5 谢谢您的建议 2008-7-28 14:25

TOP

报告BUG

参数名: index:       索引超出范围。必须为非负值并小于集合大小。
本帖最近评分记录
  • rq204 活跃度 +3 谢谢您的建议 2008-7-29 09:33
  • rq204 火车车厢 +1 谢谢您的建议 2008-7-29 09:33

TOP

sql入库,还是8个吗,有一次我做动易的入库,8个不够
本帖最近评分记录
  • rq204 火车车厢 +2 谢谢您的建议 2008-7-29 09:33
  • rq204 活跃度 +4 谢谢您的建议 2008-7-29 09:33
[url=http://bbs.flower169.com][color=red]花花世界论坛[/color] [/url]

TOP

1、能不能把免费版不能使用的功能链接去掉
2、入库模块是不是可以自己编写
3、是否再进行一些优化,使运行效率、速度、内存占用更好一些
4、一些功能是否可以单独购买
本帖最近评分记录
  • rq204 火车车厢 +4 谢谢您的建议 2008-7-31 15:20
  • rq204 活跃度 +8 谢谢您的建议 2008-7-31 15:20
http://www.shoufeng.net

TOP

在同一个站点下,(不周站点没测试过)
把A任务,复制后创建B任务,然后删除B任务的本地数据,但在采集的时候还是会提示重复地址,但B任务数据库中的地址为空.


删除站点任务地址库?不可以删除啊,删除了后,站点中的其它任务地址不是也删除了吗?

[ 本帖最后由 oo001 于 2008-7-31 16:23 编辑 ]
本帖最近评分记录
  • rq204 活跃度 +1 删除站点任务地址库 2008-7-31 15:20
haorw.com

TOP

一口气看完了所有的建议,

通常的问题都有了,我在这里只好提些小意见了,只为车厢
1.可以同时发布到两个配置里面(一次采集同时发布到两个站)
2.该标签循环匹配+添加为新记录后,采集标签为内容+递增数字时,采集同一个页面的时候,递增数字不递增
3.采集规则/标签加密(发布模板的加密也应该把里面的内容屏蔽)
4.该标签采集结果只能为数字。(为了方便自动分类)
5.补充4,全匹配替换,如:“性感美女”替换为“1”,美女替换为2  ,忽略替换的顺序(数量大得话难免顾虑不到)的话,不会出现“性感2”
6.再支持下之前某楼的用文本实现替换添加得功能,我换了3个鼠标了
7.还有配置模板的时候,如果修改了没点刷新列表的话还是旧的
8.内容页的编码和列表页的编码不同的话,要麻烦一下




以上意见只是为了方便自己
本帖最近评分记录
  • rq204 火车车厢 +5 谢谢您的建议 2008-8-3 17:54
  • rq204 活跃度 +10 谢谢您的建议 2008-8-3 17:54
接整站采集

TOP

最好有采集的数据批量替换功能
本帖最近评分记录
  • rq204 火车车厢 +1 谢谢您的建议 2008-8-3 17:50
  • rq204 活跃度 +2 谢谢您的建议 2008-8-3 17:50

TOP

免费版本有定时采集功能吗?
本帖最近评分记录
  • rq204 活跃度 +1 没有 2008-8-3 17:50

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.239700 second(s), 8 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 00:07 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档