火车采集器V2008版更新[2008-08-08][火车车厢管理制度]论坛活跃、奖励计划http://domain.locoy.com火车采集器高级版本在线订购高级版本功能及技术支持列表
返回列表 回复 发帖

火车采集器发布V1.2.0发布

火车采集器一直致力于向做最好最强的采集器看齐,本期版本V1.2.0也是蓄势已久,在原来的版本上大胆创新,使新版本相当于原版本做了一次革命性的系统结构转变。本期版本耗费了我的大量心血,但考虑许多问题,并不将它做成收费,继续提供给大家,由于软件基本上是一个人开发,根本没有什么时间写完全的帮助文档,软件都是在办公室完成的,上网很慢,家里电脑没装网,所以无法提供大量的规则和网址供大家测试,希望大家能多多共享自己的规则和cms模块出来,为完善采集器做出一点贡献。
  大家向我反映火车采集器上手比较麻烦,可能是这样,我在做用户界面水平不高,希望大家多多帮助,多多交流使用,发掘火车采集器的各项潜能。

【更新说明】火车采集器V1.2.0 build 2006-02-06

1、重构了用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器。
   独立出来由用户自定义提交自定义的登陆,刷新和发表的参数。各个cms系统都作成一个cms模块文件,放入程序文件夹下的/module/即可。
系统现自带了几个主流cms系统:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。

2、全新版的规则定义方式
    ①自定义标签:使用标签形式定义采集名,系统以后不再局限于老版本的标题,作者,出处,时间和内容5个标签,想定义多少个就多少。

    ②自定义标签下限定内容的个数,每个标签下用以限定采集内容使用的开始字符串,结束字符串,排除,替换,自定义个数,不再局限于老版本中的5个排除,2个替换。、

    ③可以选定是采集内容还是采集连接。采集连接时程序自动分析里面的地址,HTTP形式的地址可以分析并探测得到真实地址。

3、完全去掉了大家比较头疼的正则表达式。改用系统内置通配符(*),无论是开始字符串,结束字符串,排除,替换遇到不确定的内容时,一个(*)全部可以代替。


4、强大的内容分页识别
  您要做的只是用开始字符串和结束字符串定义一下 页面内分页的区域。支持可变内容通配符(*) ,然后选定一下该页面分页的形式:全部列出分页,上下页形式(较少),程序就会分析页面里的内容将所有分页合并起来。
  新版分页功能支持自定义分页连接代码,如果结合到你强大的cms,比如dedecms分页代码为#P#,选择自定义合并分页后可以完全按原文章的样子,你采集生成的页面同样有多少页!

5、加入了内容标签循环采集功能

  通常一个页面采集时只采集第一次匹配成功的内容,比如对论坛来说定义好规则后只能采集到第一楼的内容,您可以定义循环采集次数n,来限定采集多少次匹配的内容,0为采集全部匹配内容,默认为1次。

6、加入对来源网站和发表文章的目标系统的各种编码的支持

7、网址倒排序发表功能

8、完成系统自动探测地址,并实现对大文件的分块断点多线程下载 考虑到版权问题软件下载只到本地,不改连接,需要的PM我。

9、加入了设置代理服务器采集的功能。

10、由于用户可以根据自定义的标签对应修改提交的POST参数,相当于导入数据库指定表的功能,且不是对本地操作,因此该版本去掉了不甚完善的数据库导入功能。

本采集器采用Visual C#编写,可以在Windows2003下运行,若在Windows2000,Xp下运行请先到微软官方下载一个.net framework1.1或更高环境组件:
附:.net framework 1.1下载地址:http://www.microsoft.com/downloads/details.aspx?FamilyID=262D25E3-F589-4842-8157-034D1E7CF3A3&displaylang=zh-cn

请到首页下载页面下载
谢谢,永远支持火车!!!
老大,DEDE登陆不了
pw和DZ是可以的,着急亚
这次的自定义规则相当不错,可惜dede登陆不了
第二个问题,因为不能登陆dede,我就采到pw中
出现“文章程度错”

我只采了几个连接,而且在规则定义中都测试了,标题和内容正确采集,内容程度不长

请问什么问题?谢谢
新雨能登录,但伪造cookie都不能获得分类列表,填ID发帖也不成功,急啊
返回列表
售前客服QQ: 火车采集器客服 rq204, 火车采集器客服 飞越无限火车采集器客服 孤魂火车采集器客服 尘缘, 联系电话:0551-3495249(技术合作问题) 023-58436018 (08:00-20:00-客服),0752-2553545(09:00-20:00-客服)