wuji_fire 发表于 2008-3-14 16:30:40

http://www.100paper.com/100paper/jingjixue/fazhanzhanlue/2008012146964.html

我就是采集这里的

大侠 请帮忙测试一下好吧

我用的是3。2 版本

谢谢了

ws123 发表于 2008-3-14 17:32:37

你对分页采集、多页采集的概念理解不对。
你给出的是内容页的网址,该篇文章没有分页,只有上下篇,是不需要分页采集的。
你只需采集好网址列表就好了

以该页的下一篇为例
http://www.。。。。。。/xingyejingji/2008012146965.html
内容标签:
开始代码:<div class="content" id="content">
结束代码:</div>
分页区域的代码为:
<div id="pagebreak">共2页: 上一页 1 <a href='2008012146965_2.html'></a> <a href='2008012146965_2.html'>下一页</a> <p><script language="JavaScript" src="/js/art-art-top.js"></script><p><script language="JavaScript" src="/js/art3.js"></script></div>
所以:
开始代码:<div id="pagebreak">
结束代码:</div>
已经通过测试,使用全部列出模式和上下页模式都能采到2页内容。

[ 本帖最后由 ws123 于 2008-3-14 17:50 编辑 ]

wuji_fire 发表于 2008-3-14 17:32:46

坚持学习

就不信

我的努力不能得到大家的帮助

一定要弄明白

高定这个问题

坚持到底

ws123 发表于 2008-3-15 14:04:37

坚持什么啊
这不是一看就明白的吗

wuji_fire 发表于 2008-3-16 23:04:13

非常感谢

谢谢亲自采集帮忙,

小弟一定继续努力学习。

wuji_fire 发表于 2008-3-16 23:16:29

http://www.100paper.com/100paper/guanlixue/gongshangguanli/qiyezhanlue/20071209/46712.html

老大,请看这个,这个叶面该如何采集呢??

这个是有分页的。

谢谢了

wuji_fire 发表于 2008-3-17 00:04:19

这么晚了
谢谢指点我一下吧

谢谢了

ws123 发表于 2008-3-17 15:57:24

内容标签的设置:
开始代码:<div class="content" id="content">
结束代码:</div>

分页区的设置:
点选全部列出模式
开始代码:<div id="pagebreak">
结束代码:</div>
点选自动识别分页。

通过测试,确实能采到这几页内容。(实际上,使用全部列出模式和上下页模式都能采到这几页内容的)

wuji_fire 发表于 2008-3-20 14:34:56

谢谢了

wuji_fire 发表于 2008-3-20 14:35:22

我说怎么送你火车阿
我想送你一节
页: 1 [2]
查看完整版本: 兄弟初学采集,请教这个分页采集该怎么写,谢谢。