ws123 发表于 2008-3-5 14:57:48

多页面采集的个人学习体会(高手就免进了)

进行多页面采集,就是采集网页A的文章a的时候,网页A还有链接连向网页B,还要采集网页B上的文章b。

首先在“采集内容规则”设置采集网页A的规则,设置完成后,再设置多页面采集。

设置多页面采集的过程:
先在“采集内容规则”项,点击打开“同时采集多页面?”(这是设置网页B的网址的):
1. 在“页面名称”栏给需要采集的新网页起一个名字,例如填写“网页B”(这个网页名在后面是需要使用到的,会显示在内容标签的“所属页面”项);
2.“页面地址”项,点选“在默认页源代码内采集得到地址”;
3.填写“开始字符串”和“结束字符串”,这是在网页A上采集网页B的网址的。
可以测试一下,点击“测试得到多页地址”,填写网页A的网址,点击“测试”,就可以在“测试结果”中看到网页B的网址了,绝对或相对网址都是可以的。点击“保存”就可以了。

然后需要添加新标签,用来采集新的网页,例如添加“内容2”标签,然后:
1.点击打开“内容2”标签;
2.在“所属页面”项点选“网页B”(这个网页名是在前面填写设置的),即是说现在“内容2”标签是用来采集“网页B”的;
3.设置“内容2”标签的采集规则,是依据“网页B”的源代码进行设置的;
设置完成后,点击“确定”。
最后填写网页A的网址,点击“测试”,就可以看到“内容”标签采到了网页A的文章a,“内容2”标签采到了网页B的文章b。完成后,点击“更新”即可。

当然还要设置内容发布模块,进行标签合并,用[标签:内容][标签:内容2]替换原来的[标签:内容]就可以了。

[ 本帖最后由 ws123 于 2008-3-5 15:00 编辑 ]

ws123 发表于 2008-3-5 16:26:21

呵呵
谢谢加车厢。

c1a1o1 发表于 2008-3-5 16:45:24

学习了 哈哈

sixfeel 发表于 2008-4-3 02:15:17

:lol 不错,谢谢楼主

小齐 发表于 2008-4-3 09:18:14

很细心 的一篇文章

农夫 发表于 2008-6-8 14:47:36

不错,豁然开朗。

zhtzqy 发表于 2008-6-9 14:26:39

支持楼主了。真是厉害。。

ljc0311 发表于 2008-6-15 14:29:33

哈哈,太需要了.谢谢

ws123 发表于 2008-6-21 09:51:23

呵呵
谢谢加到教程区。

说下标签合并,例如要合并[标签:内容]、[标签:内容2]这两个标签:
点击打开LocoyModule.exe这个模块开发文件,点击"加载模块",选择并打开所需的模块,在文章发表参数项,用[标签:内容][标签:内容2]替换原来的[标签:内容]即可。

[ 本帖最后由 ws123 于 2008-6-21 09:53 编辑 ]

xldao 发表于 2012-5-5 22:37:06

开火车加箱子         :(:(               
页: [1]
查看完整版本: 多页面采集的个人学习体会(高手就免进了)