303718 发表于 2012-11-20 10:12:58

火车头V7dedecms5.7文章发布模块 图集发布模块 dedecms软件发布模块+文章采集规则1条

内容:

[*]火车头采集器V7版dedecms5.7文章WEB发布模块1个
[*]火车头采集器V7版dedecms5.7图集WEB发布模块1个
[*]火车头采集器V7版dedecms5.7软件WEB发布模块1个
[*]火车头采集器V7版文章采集规则1条







模块解压密码:
**** Hidden Message *****

AD:火车头dedecms系列免登陆发布接口(可自动生成首页栏目页内容页)定制联系QQ:315103700



[*]火车采集器数据抓取原理:
[*]  火车采集器如何去抓取数据,取决于您的规则。您要获取一个栏目的网页里的所有内容,需要先将这个网页的网址采下来,这就是采网址。程序按您的规则抓取列表页面,从中分析出网址,然后再去抓取获得网址的网页里的内容。再根据您的采集规则,对下载到的网页分析,将标题内容等信息分离开来并保存下来。如果您选择了下载图片等网络资源,程序会对采集到的数据进行分析,找出图片,资源等的下载地址并下载到本地。
[*]火车采集器数据发布原理:
[*]  在我们将数据采集下来后数据默认是保存在本地的,我们可以使用以下几种方式对数据进行处理。
1、不做任何处理。因为数据本身是保存在数据库的(access、db3、mysql、sqlserver),您如果只是查看数据,直接用相关软件打开查看即可。
2、Web发布到网站。程序会模仿浏览器向您的网站发送数据,可以实现您手工发布的效果。
3、直接入数据库。您只需写几个SQL语句,程序会将数据按您的SQL语句导入到数据库中。
[*]4、保存为本地文件。程序会读取数据库里的数据,按一定格式保存为本地sql或是文本文件。
[*]火车采集器工作流程:
[*]  火车采集器采集数据是分成两个步骤的,一是采集数据,二是发布数据。这两个过程是可以分开的。
1、采集数据,这个包括采集网址,采集内容。这个过程是获得数据的过程。我们做规则,在采的过程中也算是对内容做了处理。
2、发布内容就是将数据发布到自己的论坛,CMS的过程,也是实现数据为已有的过程。可以用WEB在线发布,数据库入库或存为本地文件。
具体的使用其实是很灵活的,可以根据实际来决定。比如我可以采集时先采集不发布,有时间了再发布,或是同时采集发布,或是先做发布配置,也可以在采集完了再添加发布配置。总之,具体过程由您而定,火车采集器的强大功能之一也就是体现在灵活中。

asktao 发表于 2012-11-20 12:04:45

dddddddddddddddddddddd

long198712 发表于 2012-11-20 13:55:25

我看看
可能是我需要的

namellx 发表于 2012-11-20 21:00:02

太好了:hug::lol:hug::hug:

6738437 发表于 2012-11-21 09:59:15

可用于7.6吗?好久没用了发现7.6变了.

weixinjoy 发表于 2012-11-21 14:24:43

这个要大力支侍哈哈哈

zhjm1223 发表于 2012-11-21 14:28:35

看看什么样的:lol

qewuqa 发表于 2012-11-22 21:11:02

好东西啊,收下了谢谢

fbww 发表于 2012-11-23 10:26:15

测试看看怎么样啊

shjowhut 发表于 2012-11-23 11:20:18

下载下来看一下好不好用,谢谢了
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: 火车头V7dedecms5.7文章发布模块 图集发布模块 dedecms软件发布模块+文章采集规则1条