|
本次更新又增加了不少,修改了了许多存在的问题,重新开帖发布
火车采集器配备的全站HTML生成器工具还待进行一下关键词和模板方面的优化,稍候几天发布
3.2 SP3版更新内容[2007-11-01]
增加了对数据库发布设置的保存,针对任务可以和Web发布设置一样选择不同的数据库发布设置
增加了全局敏感词过滤和近义词替换功能 ----[该功能集成在标准版内]
增加了对非默认端口导出到Mysql和mssql的支持
增加了对单任务设置采集、发布线程数,间隔时间,及发布到哪定义为成功的设置
增加了强力时间格式转化功能,WEB发布模块增加[时间转换]标签和[系统时间戳]标签,可以将采集过的时间重新编排为任意格式或时间戳格式
增加了设置单标签是否循环匹配的功能
增加了压缩任务ACCESS数据库的功能
增加了迅雷&FlashGet加密解密工具
增加了软件对迅雷&FlashGet地址的解密并自动下载文件的功能 ------[该功能集成在个人,标准版内]
增加了系统对Form表单,li,ul,frame,hr,h1-7等html标签的排除,修正了无法排除Script标签的功能
增加了对每个标签可设置是否循环匹配的功能,结合添加为新记录可针对任何标签添加出多条记录
增加了对取出的内容中第一张图为缩略图并下载的功能
增加了起始地址向导添加内使用正则提取网址的功能
增加了任务列表向任务运行显示区拖曳后开始采集的小功能
更新了自动更新的设置方式,SP3中可设置按每天,每个星期中的那天,单次运行,在某个时间段内间隔多少分钟运行一次 ---- [该功能集成在个人,标准版内]
更新了手动分页的设置方式,可设置任意多参数和使用参数组合出分页网址
修正了在包含#符号的非锚点网址采集地址出错的问题
修正了在包含../../等上一级超过域名最顶级后地址出错的问题
修正了WEB在线发布模块编辑器内多次加载出现随机值列表框内值混乱的问题
修正了在下载文件时无法使用代理服务器的问题
修正了对部分网站采集无法得到源代码的情况
修正了下载缩略图时内容内缩略图地址无法对应的问题
修正了保存为TXT文件时没有保存缩略图的问题
修正了没有可采集网址和可发布的内容任务无法自动停止的问题
修正了带中文的网址在测试时可以采集但正式采集时无法采集到下级网址的问题
修正了中文网址采集时导入本地任务数据库[程序目录/data/任务名/SpiderResult.mdb]错误的问题
修正了导入文本网址时文本为空时预览报错的问题
更新了编辑任务时ESC退出的不合理设计,更改显示隐藏热键为Ctrl+F8
3.2 SP2版更新内容[2007-09-26]
增加了调用迅雷或FlashGet等成熟下载组件下载文件的功能 (该功能集成到高级版内)
增加了自动关机功能
增加内置浏览器自动抓取POST数据包的功能
增加了Shift+S软件显示/隐藏热键
增加了屏蔽默认缩略图功能
增加了[随机抽取值]标签,比如从自定义的作家中随机抽取一个作者
增加了设置内容中第一张图片为缩略图的功能
增加了发布内容间隔时间(以前采集和发布间隔时间一样)
增加了添加采集起始地址的预览功能
增加了开始采集地址内确认地址可删除的功能
增加了每次最大发布条数的功能,适合多次更新少量内容
修正了SP1中删除地址库和任务数据库失效的问题
修正了标签编辑框添加或编辑标签后的自动排列功能
修正了以前长期出现的采集过程中或打开全局配置出现未将对象引用设置到对象实例的错误
修正了排除<script>标签但保留了中间内容的bug
修正了批量添加时选中补零条件,时间隔倍数不起作用的一个bug
修正了使用Urlencode时没有对[采集页地址]标签encode的bug
修正了多次采集列表时会重复下载缩略图的问题
修正了自定义标签内系统时间的问题
修正了SP1中站点导出后不能导入的问题
修正了自动拼音中英文单词间无间隔符号的问题
完善了内置浏览器,增加多页浏览和自动抓取数据包功能
修正了原来系统时间12小时制为24小时制
完善了下载论坛附件功能,加入了对ftp地址的识别
完善了复制任务或标签后再粘帖生成多个副本保持名称不一样
修正了入库时对{和}正反大括号的排除问题
修正了SP1中PHPCMS,Supsite对用户客户端有要求的程序无法登录发布成功的问题
火车采集器3.2正式版发布【最后更新:20070910】
火车头团队一直致力于为广大网站站点提供数据信息和实用的工具软件, 开发团队秉承“专业,专注,沉着,创新”的理念,用实力铸造精品。
经过2007年3月至2007年9月,近5个多个月的研发及几个版本的内部测试,一个具有全新内核和架构的强大信息采集,数据加工软件--火车采集器3.2版
呈献在大家面前,为始终支持和关爱火车软件发展的站长们献上一份谢礼。
火车采集器1.X-3.X一直免费使用并深受广大站长欢迎,通过大家对3.2测试版的反馈,无论在性能,功能和稳定性上面3.2都是以前版本无法比拟的,
我们此次发布的3.2正式版同样也是免费使用,没有任何限制(功能上附带3.1版的所有基本功能及3.2内部测试版发布的所有功能)
同时为了软件和更好发展及为部分用户更好的技术支持,3.2版也发布支持更多SEO功能和技术支持的个人、标准和企业版三种高级版本,各位朋友可按需选用 高级版本请访问这里
3.2版功能简介
继承3.1的优点,站点+任务式管理,多任务多线程同时运行
3.1版的基本功能可查看这里 http://www.locoy.com/article/show.php?itemid-8/page-1.html
下面仅对3.2正式版中新增的功能做简单列表:
采网址,采内容,发内容三个步骤可以分开分步操作
增加缩略图采集功能,并能保存到本地文件
增加多页采集,使采集多页下载链接或产品多页图片,参数,评论,价格内容成为可能
增加自定义网页编码类型,默认任何编码页都可以实现内部转换,都能正确采集,发布时请选择目标UTF8
增加循环采集(可采集列表和论坛回复列表类似的网页)
增加将循环采集匹配到的结果添加为新记录和间隔符分割的功能
增加内容采集中使用正则匹配的功能
增加WEB发布配置,保存每个网站的发布配置,单任务可以发布到多网站,但任务可以发布到网站的不同栏目
增加数据库发布模块,去掉以前的数据库直导配置,成熟的发布模块可以使不懂数据库结构的人使用数据库直导成为可能
增加分页采集自定义地址格式的功能,完善以前的分页采集中上10页下10页这种无法采集的问题
增加源代码查看和测试工具
增加软件内动态帮助,使用更为方便..
增加对任意采集标签里的内容自动生成摘要和自动拼音的功能
增加保存到本地SQL文件的功能(3.1中未完成),完善各种在线发布和数据库发布功能
改进了下载算法,使下载图片和其他任意格式的文件更快更稳
还有本地任务数据编辑再发布功能 ,
自动获取tag(生成中文关键词功能),
自动英文->中文翻译功能 ,
任务定时自动更新功能 ,
任意格式文件下载功能 ,
(ACCESS,MYSQL,MSSQL)数据库发布模块编辑器
在高级版本中发布,如果需要这些高级功能或获取更多技术支持,请访问:链接
关键词:采网址 采内容 发内容 分步 缩略图 本地 循环采集 多页采集 分页采集 自动拼音 生成摘要 自定义网页编码 数据库发布模块 多网站发布 自动关键词 自动翻译 ACCESS MYSQL MSSQL 自动更新
3.2版,3.2SP1版到SP2版的升级程序到这里下载:http://bbs.locoy.com/spider-18595-1-1.html
使用教程:
如果您有使用火车头以前版本的基础,相信3.2使用起来会更加得心应手
我们也为你准备好三套视频+语音的入门全面教程
请访问
火车头内容采集器3.2版采集实战教程一 http://bbs.locoy.com/spider-17468-1-1.html
火车头内容采集器3.2版采集实战教程二 http://bbs.locoy.com/spider-17815-1-1.html
火车头内容采集器3.2版模块制作教程 http://bbs.locoy.com/spider-17142-1-1.html
商业版用户下载更新地址请关注我们的论坛通知或高级群内公告
3.2SP3正式版下载地址( 见附件1)
3.2SP2正式版->SP3正式版升级程序下载地址( 见附件2) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|