火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: rq204

火车采集器2011版功能建议帖

[复制链接]
发表于 2011-4-8 16:43:42 | 显示全部楼层
取消硬件绑定 收费很黑

评分

1

查看全部评分

发表于 2011-4-8 16:46:04 | 显示全部楼层
根据关键词采集相关内容
文章伪原创 打乱顺序啥的

评分

1

查看全部评分

发表于 2011-4-8 16:48:50 | 显示全部楼层
1、WEB发布模块“发表地址后缀”里“[登录随机值]”标签无效的。
2、采集图片自动加水印。
3、多页采集的循环采集。

评分

1

查看全部评分

发表于 2011-4-8 17:00:37 | 显示全部楼层
我也提一句

希望采集的标签可以嵌套使用

评分

1

查看全部评分

发表于 2011-4-8 17:13:57 | 显示全部楼层
1:将全局关键词替换的功能分配在指定任务执行
单个任务可以选择打开或关闭此替换功能,这样比较方便些;

评分

1

查看全部评分

发表于 2011-4-8 17:17:02 | 显示全部楼层
本帖最后由 kang3bao 于 2011-4-8 17:19 编辑

我也来提两点
一、取消硬件绑定,使用账号登录。费用可以维持不变
目前还是纠结于硬件绑定,而不敢于下单购买火车头,困扰在于,在公司使用公司电脑,虽然有时候可以开着,但是毕竟是公司的电脑,随时可能会更换。如果绑在自己的电脑上,又舍不得一直开着,而且家里网速也不理想。如果用加密狗的话,有时候会用VPS等服务器挂着采集,那肯定也不现实了。
二、希望能增加分页的多页采集功能,目前实现上还是有集限
比如说一个内容页的某个标签 需要用分页采集   但这个分页如果有多页的话,而又想全部采集下来的话,实现上有点困难,虽然可以把多页当内容页采集,但这样过于复杂
三、希望官方加强对于商业版用户的配套支持
比如我们现在如果购买商业版,但如果要发布论坛,又需要另行找别人购买发布接口,如果要找人购买接口,我用免费版的火车头就可以了
所以又减弱了购买火车头的信心

评分

1

查看全部评分

发表于 2011-4-8 17:22:21 | 显示全部楼层
OCR识别 ……………………

评分

1

查看全部评分

发表于 2011-4-8 17:59:55 | 显示全部楼层
加强自动分词模块:
1  可指定每个词的权重。
2  支持中英混合关键词。

评分

1

查看全部评分

发表于 2011-4-8 22:21:03 | 显示全部楼层
我也提一句

希望采集的标签可以嵌套使用
pp0613 发表于 2011-4-8 17:00


   标签现在可以嵌套用了
发表于 2011-4-9 13:37:56 | 显示全部楼层
***来支持一下。
以下建议:
1、多页采集:在现有多页采集的模式上增加采集最大页数的方式进行循环采集。也就是说在第一个页面采集到一个页面变量的最大值,以此循环去匹配采集;
2、通常的列表页作为0级采集页面进行post方式获取数据的采集,当前火车头不支持post页面的列表页0深度采集;
3、采集下载的文件名命名方式,在现有基础上增加用任务中的采集字段作为变量去命名的方式;
4、数据库转换的方式,保留原有数据。当前如果修改数据库存储模式的话,会直接清空本地的采集数据,希望能直接将数据转换到新的存储方式;如果不能实现转换的话,至少保留原有数据库;
5、当前如果使用mysql作为数据库的话,在入库的时候会有出现信息不能采集入库的方式,建议规范数据库的入库方式,具体的测试结果不方便在这里发布就不多说了。
6、增加加密狗用户的使用限制,最好是能对加密狗的识别方式上做一些调整,我最近用的是总是出现软件自动退出的情况。
7、别的也不多说太多。希望能对收费用户增加一些福利,比如通用程序的入库和发布模块。
8、未完待续。。。

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-3-31 07:05

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表