采集最人性的方式就是可视化,,本来以为不可能,结果还真有这样的软件
火车作者参考一下啊现在火车定型了 估计采用这种理念不可能了他拉框划定采集范围就给采集了,,当然现在火车的正则学会了后也还是很方便,,,不知道2者的精确度是不是一样
[绿色**版] 下载 易采网站数据采集系统_1.7.2.rar
图片为采集落伍的演示
用火车以前,一直都希望有这种采集方式,在要采集的对象上划定范围就ok现在果然还有这样的采集器,,,,还没有仔细测试不知道能不能达到火车那样的分页,内容页等的采集
截图为采集 im286列表的演示
软件特色:
1. 图形化的采集任务定义界面 你只需在软件内嵌的浏览器内用鼠标点选你要采集的网页内容即可配置采集任务,无需像其它同类软件一样面对复杂的网页源码去寻找采集规则。可以说是所见即所得的采集任务配置界面。
2. 创新的内容定位方式,定位更准确、稳定 同类软件基本上都是根据网页源码中的前导标记和结束标记进行内容定位,这样一来,用户就不得不自己去面对网页制作人员才需要面对的HTML代码,付出更多额外的学习时间才能掌握软件的使用。同时,只要网页内容稍有变更(简单的如改变一下文字的颜色)定位标记即极有可能失效,导致采集失败。我们经过艰难的技术攻关,实现了全新的定位方式:结构定位和相对标志定位。大家都知道,一个网站的风格基本上是固定的,其同类网页内容的编排布局基本相同。这就是结构定位可行之处。当然基本相同不等于100%相同,不过,我们攻克了技术难关,消除了这些障碍。我们的定位方式的优势在于:1.用户只需用鼠标点击就可以配置采集任务,实现所见即所得的采集任务配置界面;2.网页内容的变化(如文字增减、变更,文字颜色、字体的变化等)不会影响采集的准确性。
3. 支持任务嵌套,可采集无限级的页面内容 只需在当前任务的页面中选择指向你要采集的下级页面的链接,即可建立嵌套任务,采集下级页面的内容,且嵌套级数不限。这种便利都得益于我们全新的内容定位方式和图形化的采集任务配置界面。
4. 可同时采集任何内容 除了最基本的文字、图片、文件外,还可以采集针对具体HTML标签的源码、属性值等。
5. 强大的信息自动再加工能力 你可以在配置任务的时候,指定对采集到的内容进行任何的替换、筛选。
6. 可对采集到的内容进行自动排序
7. 支持采集结果保存到EXCEL和任意格式的文件 支持自定义文件模板。
8. 支持实时保存到数据库 支持ACCESS、SQLSERVER、MYSQL数据库(后续版本还将支持更多类型的数据库)。
9. 支持实时上传到网站服务器 支持POST和GET方式,可自定义上传参数,模拟人工提交
10. 支持实时保存到任意格式的文件 支持自定义模板,支持按记录保存和将多个记录保存到单个文件,支持大纲、明细式的保存(所有记录的某些内容保存到一个大纲文件中,然后每条记录又单独保存到一个文件。
11. 支持多种灵活的任务调度方式,实现无人值守采集
12. 支持多任务,支持任务导入和导出
http://i3.6.cn/cvbnm/75/bd/74/b5288f26cfaebc454462383a37c7ef81.jpg
http://i3.6.cn/cvbnm/d3/0c/c1/44fc77717a2ec259ade5717cfcbb6adf.jpg
易采网站数据采集系统 1.7.2 [绿色**版] 下载 易采网站数据采集系统_1.7.2.rar
软件大小: 2.76 M 热门等级:
更新时间: 2008-11-12 联 系 人: digeststargmail.com
下载次数: 4471 开 发 商: http://www.digeststar.com/
界面预览: 无 软件类别: 国产软件 / 程序源码
软件语言: 简体中文 应用平台: Win2000/WinXP/Win2003
软件性质: 共享软件
易采网站数据采集系统是一款功能全面、准确、稳定、易用的网络信息采集软件。它可以轻松将你想要的网页内容(包括文字、图片、文件、HTML源码等)抓取下来。采集到的数据可以直接导出到EXCEL、也可以按照你定义的模板保存成任何格式的文件(如保存成网页文件、TXT文件等)。也可以在采集的同时,实时保存到数据库、发送到网站服务器、保存到文件。
软件特色:
1.图形化的采集任务定义界面 你只需在软件内嵌的浏览器内用鼠标点选你要采集的网页内容即可配置采集任务,无需像其它同类软件一样面对复杂的网页源码去寻找采集规……
界面截图:
http://bbs.7softs.com/attachment/33_1007_223b998c6992b6d.gif
说明:
1、下载解压即可,无需安装!
2、随意输入8位数字即可完成激活!
[ 本帖最后由 84542649 于 2008-11-16 15:14 编辑 ] 哇。。。你这样做太。。我真想像不到还有这样的软件。 是比较强大,不过个人觉得如果有一些防采的措施,这种采集方式就没有办法处理了.在火车里加上这个功能和原有的综合使用,无敌了. 用版1.保存到EXCEL文件 限制3条记录
2.导出到自定义文件 限制3条记录
3.自动保存记录到EXCEL文件 限制3条记录
4.自动保存记录到自定义文件 限制3条记录
5.自动保存记录到网站 限制3条记录
6.自动保存到记录到数据库 限制3条记录
免费
个人版1.保存到EXCEL文件 无限制,可保存全部记录
2.导出到自定义文件 限制3条记录
3.自动保存记录到EXCEL文件 无限制,可保存全部记录
4.自动保存记录到自定义文件 限制3条记录
5.自动保存记录到网站 限制3条记录
6.自动保存到记录到数据库 限制3条记录
¥498元点这里到《软行天下共享软件注册中心》
注册购买个人版
专业版1.保存到EXCEL文件 无限制,可保存全部记录
2.导出到自定义文件 无限制,可导出全部记录
3.自动保存记录到EXCEL文件 无限制,可保存全部记录
4.自动保存记录到自定义文件 限制3条记录
5.自动保存记录到网站 限制3条记录
6.自动保存到记录到数据库 限制3条记录
¥980元点这里到《软行天下共享软件注册中心》
注册购买专业版
企业版1.保存到EXCEL文件 无限制,可保存全部记录
2.导出到自定义文件 无限制,可导出全部记录
3.自动保存记录到EXCEL文件 无限制,可保存全部记录
4.自动保存记录到自定义文件 无限制,可保存全部记录
5.自动保存记录到网站 无限制,可保存全部记录
6.自动保存到记录到数据库 无限制,可保存全部记录
¥2000元点这里到《软行天下共享软件注册中心》
注册购买企业版 抢钱啊。。。也不必火车头强到哪里去不过适合菜鸟 不懂代码的站长了
自己看看吧980 的都买不到 发到网站的 权限需要2000汗S了。。。。真以为中国站长赚钱容易啊。。。 还不错,研究一下,有时候换着用应该有不一样的效果 我下载了一个1.7.2**版,不知道会不会有限制,没有很认真的研究 呵呵钱呀咱们还没有赚钱呢 我是lz我测试了,,无法导出数据,,, 大家不要下了
回复 3楼 的帖子
我发这个主要就是介绍一种思路,,,不是想帮人家卖广告在火车没学会前就一直希望有这样的操作方式,,,设定采集范围就ok
至于你说的防采的措施 我觉得应该不存在
因为实际你用就会发现 点选你采集范围的时候,他程序实际做的也是选择网页html标记的工作
只不过一切可视化了
他另外有个软件叫什么网页内容截取的,,就是专门对付被遮挡文字的
[ 本帖最后由 84542649 于 2008-11-17 15:44 编辑 ]
页:
[1]
2