zhao123 发表于 2008-7-27 10:06:13

我的电脑只能用到sp1版本 其他会出错
sp1版本 采集标题的正则替换功能有问题。

diligency 发表于 2008-7-27 14:44:35

1.
建议“自定义固定格式的数据”-“随机抽取信息”设定出现的频率均等“自定义固定格式的数据”-“随机抽取信息”里,
一行一条内容信息出现的频率不是均等的。

希望这个“一行一条内容信息”出现的频率是均等的。

比如作者标签有:火车头、孤魂、麦兜3行内容,如果发布3篇文章,就让它们都只出现一次。
可以按顺序出现,或者随机出现都可以,最重要的是让它们出现的几率都是一样的


2.
火车头的“任务自动更新”功能:设定了火车头的“任务自动更新”的时间之后,
如果关闭了这个火车头软件,重新打开的时候;原有设置的自动更新全部失效了。


3.
采集文章的时候的内容替换功能:希望在“采集内容规则”的“内容替换”里面实现 标签替换 的功能,
比如在采集的时候设置,把要采的文章内容中的所有“中国”这个词替换为“[标签:标题]"。
那么效果如下:
原文标题1:幸福
原文内容1:我是一个中国小朋友
原文标题2:快乐
原文内容2:熊猫是中国的动物


采集发布后的标题1:幸福
采集发布后的标题1:我是一个幸福小朋友 (内容中的“中国”这个词替换成[标签:标题],即替换成幸福)
采集发布后的标题2:快乐
采集发布后的标题2:熊猫是快乐的动物 (内容中的“中国”这个词替换成[标签:标题],即替换成快乐)

[ 本帖最后由 diligency 于 2008-7-27 14:47 编辑 ]

网络下 发表于 2008-7-28 13:51:58

1 标签窗口 太小了,有的时候使用正则 编辑 很不方便 ,应该 有个自适应的窗口
2新建的采集站点,任务等其他功能要多增加 这样就减少在 本内规则下的任务 编辑了
3 火车头 外观 很土!希望得到可以更改好的皮肤。

                      火车 很好 很强大!:ali12ls

hzd888 发表于 2008-7-28 21:56:17

报告BUG

参数名: index:       索引超出范围。必须为非负值并小于集合大小。

smj328 发表于 2008-7-28 22:15:17

sql入库,还是8个吗,有一次我做动易的入库,8个不够

lfh19 发表于 2008-7-31 08:54:38

1、能不能把免费版不能使用的功能链接去掉
2、入库模块是不是可以自己编写
3、是否再进行一些优化,使运行效率、速度、内存占用更好一些
4、一些功能是否可以单独购买

oo001 发表于 2008-7-31 14:28:00

在同一个站点下,(不周站点没测试过)
把A任务,复制后创建B任务,然后删除B任务的本地数据,但在采集的时候还是会提示重复地址,但B任务数据库中的地址为空.


删除站点任务地址库?不可以删除啊,删除了后,站点中的其它任务地址不是也删除了吗?

[ 本帖最后由 oo001 于 2008-7-31 16:23 编辑 ]

qqriz 发表于 2008-7-31 22:33:05

一口气看完了所有的建议,

通常的问题都有了,我在这里只好提些小意见了,只为车厢
1.可以同时发布到两个配置里面(一次采集同时发布到两个站)
2.该标签循环匹配+添加为新记录后,采集标签为内容+递增数字时,采集同一个页面的时候,递增数字不递增
3.采集规则/标签加密(发布模板的加密也应该把里面的内容屏蔽)
4.该标签采集结果只能为数字。(为了方便自动分类)
5.补充4,全匹配替换,如:“性感美女”替换为“1”,美女替换为2,忽略替换的顺序(数量大得话难免顾虑不到)的话,不会出现“性感2”
6.再支持下之前某楼的用文本实现替换添加得功能,我换了3个鼠标了
7.还有配置模板的时候,如果修改了没点刷新列表的话还是旧的
8.内容页的编码和列表页的编码不同的话,要麻烦一下




以上意见只是为了方便自己:lol

hyp959 发表于 2008-8-1 09:28:45

最好有采集的数据批量替换功能 :ali10ls

tianjian8 发表于 2008-8-1 23:21:44

免费版本有定时采集功能吗?
页: 1 2 3 4 5 [6] 7 8
查看完整版本: 火车采集器2008版意见征集帖