兄弟初学采集，请教这个分页采集该怎么写，谢谢。 - 第2页 - 采集器基础使用讨论区 - 火车采集器软件交流官方论坛

wuji_fire 发表于 2008-3-14 16:30:40

http://www.100paper.com/100paper/jingjixue/fazhanzhanlue/2008012146964.html

我就是采集这里的

大侠请帮忙测试一下好吧

我用的是3。2 版本

谢谢了

ws123 发表于 2008-3-14 17:32:37

你对分页采集、多页采集的概念理解不对。
你给出的是内容页的网址，该篇文章没有分页，只有上下篇，是不需要分页采集的。
你只需采集好网址列表就好了

以该页的下一篇为例
http://www.。。。。。。/xingyejingji/2008012146965.html
内容标签：
开始代码：<div class="content" id="content">
结束代码：</div>
分页区域的代码为：
<div id="pagebreak">共2页: 上一页 1 <a href='2008012146965_2.html'></a> <a href='2008012146965_2.html'>下一页</a> <p><script language="JavaScript" src="/js/art-art-top.js"></script><p><script language="JavaScript" src="/js/art3.js"></script></div>
所以：
开始代码：<div id="pagebreak">
结束代码：</div>
已经通过测试，使用全部列出模式和上下页模式都能采到2页内容。

[ 本帖最后由 ws123 于 2008-3-14 17:50 编辑 ]

wuji_fire 发表于 2008-3-14 17:32:46

坚持学习

就不信

我的努力不能得到大家的帮助

一定要弄明白

高定这个问题

坚持到底

ws123 发表于 2008-3-15 14:04:37

坚持什么啊
这不是一看就明白的吗

wuji_fire 发表于 2008-3-16 23:04:13

非常感谢

谢谢亲自采集帮忙，

小弟一定继续努力学习。

wuji_fire 发表于 2008-3-16 23:16:29

http://www.100paper.com/100paper/guanlixue/gongshangguanli/qiyezhanlue/20071209/46712.html

老大，请看这个，这个叶面该如何采集呢？？

这个是有分页的。

谢谢了

wuji_fire 发表于 2008-3-17 00:04:19

这么晚了
谢谢指点我一下吧

谢谢了

ws123 发表于 2008-3-17 15:57:24

内容标签的设置：
开始代码：<div class="content" id="content">
结束代码：</div>

分页区的设置：
点选全部列出模式
开始代码：<div id="pagebreak">
结束代码：</div>
点选自动识别分页。

通过测试，确实能采到这几页内容。(实际上,使用全部列出模式和上下页模式都能采到这几页内容的)

wuji_fire 发表于 2008-3-20 14:34:56

谢谢了

wuji_fire 发表于 2008-3-20 14:35:22

我说怎么送你火车阿
我想送你一节

页: 1 [2]

火车采集器软件交流官方论坛's Archiver