lunacory 发表于 2010-3-18 15:41:14

求助文章分页的内容怎么采集?

本帖最后由 lunacory 于 2010-3-18 15:44 编辑

这个是没有分页的内容代码:
网址:http://world.huanqiu.com/roll/2010-03/748771.html   
<div id="text">
         <!--中间这里是文本内容-->
</div>
这个是有分页的内容代码:
网址:http://world.huanqiu.com/roll/2010-03/748493.html
<div id="text">                                                                  
<div class="contentpage"> 1<a href="http://world.huanqiu.com/roll/2010-03/748493_2.html">2</a> [<a href='http://world.huanqiu.com/roll/2010-03/748493_2.html'>下一页</a>]</div>
<!--中间是文本内容-->
<div class="contentpage"> 1<a href="http://world.huanqiu.com/roll/2010-03/748493_2.html">2</a> [<a href='http://world.huanqiu.com/roll/2010-03/748493_2.html'>下一页</a>]</div>                           
   </div>
<!--_##contentnav##_-->   注:这行内容没有分页的文章没有


问题是这样的:
如果是没有分页的文章,采集内容代码选择从       <div id="text">      到 </div>就行了如果是有分页的文章,内容采集代码开头可以是<div id="text">,但是结尾不知道该怎么处理了。因为这个网页的分页标签用了div开头,<div id="text">之后的第一个</div>之间是分页内容,不是文章内容。但是要用同一个规则即能采集无分页的文章,也能采集有分页的文章我就不知道该咋办了。如果是用<p class='fpage'>(*)</p>这样的我会处理。

所以还请大侠们指点一下,万分感谢!

lunacory 发表于 2010-3-19 01:40:48

没有大侠指点一下么 {:3_164:}

z20088 发表于 2010-3-19 08:46:26

同等答案{:4_192:}

paorui 发表于 2010-3-19 12:00:37

使用自定义连接 禁用系统连接
淘宝店冲3钻 全部小问题只需要1元钱联系QQ 1321993296
页: [1]
查看完整版本: 求助文章分页的内容怎么采集?