查看完整版本: 多页面采集的个人学习体会(高手就免进了)

ws123 2008-3-5 14:57

多页面采集的个人学习体会(高手就免进了)

进行多页面采集,就是采集网页A的文章a的时候,网页A还有链接连向网页B,还要采集网页B上的文章b。

首先在“采集内容规则”设置采集网页A的规则,设置完成后,再设置多页面采集。

设置多页面采集的过程:
先在“采集内容规则”项,点击打开“同时采集多页面?”(这是设置网页B的网址的):
1. 在“页面名称”栏给需要采集的新网页起一个名字,例如填写“网页B”(这个网页名在后面是需要使用到的,会显示在内容标签的“所属页面”项);
2.“页面地址”项,点选“在默认页源代码内采集得到地址”;
3.填写“开始字符串”和“结束字符串”,这是在网页A上采集网页B的网址的。
可以测试一下,点击“测试得到多页地址”,填写网页A的网址,点击“测试”,就可以在“测试结果”中看到网页B的网址了,绝对或相对网址都是可以的。点击“保存”就可以了。

然后需要添加新标签,用来采集新的网页,例如添加“内容2”标签,然后:
1.点击打开“内容2”标签;
2.在“所属页面”项点选“网页B”(这个网页名是在前面填写设置的),即是说现在“内容2”标签是用来采集“网页B”的;
3.设置“内容2”标签的采集规则,是依据“网页B”的源代码进行设置的;
设置完成后,点击“确定”。
最后填写网页A的网址,点击“测试”,就可以看到“内容”标签采到了网页A的文章a,“内容2”标签采到了网页B的文章b。完成后,点击“更新”即可。

当然还要设置内容发布模块,进行标签合并,用[标签:内容][标签:内容2]替换原来的[标签:内容]就可以了。

[[i] 本帖最后由 ws123 于 2008-3-5 15:00 编辑 [/i]]

ws123 2008-3-5 16:26

呵呵
谢谢加车厢。

c1a1o1 2008-3-5 16:45

学习了 哈哈

sixfeel 2008-4-3 02:15

:lol 不错,谢谢楼主

小齐 2008-4-3 09:18

很细心 的一篇文章

农夫 2008-6-8 14:47

不错,豁然开朗。

zhtzqy 2008-6-9 14:26

支持楼主了。真是厉害。。

ljc0311 2008-6-15 14:29

哈哈,太需要了.谢谢

ws123 2008-6-21 09:51

呵呵
谢谢加到教程区。

说下标签合并,例如要合并[标签:内容]、[标签:内容2]这两个标签:
点击打开LocoyModule.exe这个模块开发文件,点击"加载模块",选择并打开所需的模块,在文章发表参数项,用[标签:内容][标签:内容2]替换原来的[标签:内容]即可。

[[i] 本帖最后由 ws123 于 2008-6-21 09:53 编辑 [/i]]
页: [1]
查看完整版本: 多页面采集的个人学习体会(高手就免进了)
售前客服QQ: 火车采集器客服 rq204, 火车采集器客服 飞越无限火车采集器客服 孤魂火车采集器客服 尘缘, 联系电话:0551-3495249(技术合作问题) 023-58436018 (08:00-20:00-客服),0752-2553545(09:00-20:00-客服)