找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 7581|回复: 9

多页面采集的个人学习体会(高手就免进了)

 关闭 [复制链接]
发表于 2008-3-5 14:57:48 | 显示全部楼层 |阅读模式
进行多页面采集,就是采集网页A的文章a的时候,网页A还有链接连向网页B,还要采集网页B上的文章b。

首先在“采集内容规则”设置采集网页A的规则,设置完成后,再设置多页面采集。

设置多页面采集的过程:
先在“采集内容规则”项,点击打开“同时采集多页面?”(这是设置网页B的网址的):
1. 在“页面名称”栏给需要采集的新网页起一个名字,例如填写“网页B”(这个网页名在后面是需要使用到的,会显示在内容标签的“所属页面”项);
2.“页面地址”项,点选“在默认页源代码内采集得到地址”;
3.填写“开始字符串”和“结束字符串”,这是在网页A上采集网页B的网址的。
可以测试一下,点击“测试得到多页地址”,填写网页A的网址,点击“测试”,就可以在“测试结果”中看到网页B的网址了,绝对或相对网址都是可以的。点击“保存”就可以了。

然后需要添加新标签,用来采集新的网页,例如添加“内容2”标签,然后:
1.点击打开“内容2”标签;
2.在“所属页面”项点选“网页B”(这个网页名是在前面填写设置的),即是说现在“内容2”标签是用来采集“网页B”的;
3.设置“内容2”标签的采集规则,是依据“网页B”的源代码进行设置的;
设置完成后,点击“确定”。
最后填写网页A的网址,点击“测试”,就可以看到“内容”标签采到了网页A的文章a,“内容2”标签采到了网页B的文章b。完成后,点击“更新”即可。

当然还要设置内容发布模块,进行标签合并,用[标签:内容][标签:内容2]替换原来的[标签:内容]就可以了。

[ 本帖最后由 ws123 于 2008-3-5 15:00 编辑 ]

评分

1

查看全部评分

 楼主| 发表于 2008-3-5 16:26:21 | 显示全部楼层
呵呵
谢谢加车厢。
发表于 2008-3-5 16:45:24 | 显示全部楼层
学习了 哈哈
发表于 2008-4-3 02:15:17 | 显示全部楼层
不错,谢谢楼主
发表于 2008-4-3 09:18:14 | 显示全部楼层
很细心 的一篇文章
发表于 2008-6-8 14:47:36 | 显示全部楼层
不错,豁然开朗。
发表于 2008-6-9 14:26:39 | 显示全部楼层
支持楼主了。真是厉害。。
发表于 2008-6-15 14:29:33 | 显示全部楼层
哈哈,太需要了.谢谢
 楼主| 发表于 2008-6-21 09:51:23 | 显示全部楼层
呵呵
谢谢加到教程区。

说下标签合并,例如要合并[标签:内容]、[标签:内容2]这两个标签:
点击打开LocoyModule.exe这个模块开发文件,点击"加载模块",选择并打开所需的模块,在文章发表参数项,用[标签:内容][标签:内容2]替换原来的[标签:内容]即可。

[ 本帖最后由 ws123 于 2008-6-21 09:53 编辑 ]
发表于 2012-5-5 22:37:06 | 显示全部楼层
开火车  加箱子                          
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表