求助文章分页的内容怎么采集?
本帖最后由 lunacory 于 2010-3-18 15:44 编辑这个是没有分页的内容代码:
网址:http://world.huanqiu.com/roll/2010-03/748771.html
<div id="text">
<!--中间这里是文本内容-->
</div>
这个是有分页的内容代码:
网址:http://world.huanqiu.com/roll/2010-03/748493.html
<div id="text">
<div class="contentpage"> 1<a href="http://world.huanqiu.com/roll/2010-03/748493_2.html">2</a> [<a href='http://world.huanqiu.com/roll/2010-03/748493_2.html'>下一页</a>]</div>
<!--中间是文本内容-->
<div class="contentpage"> 1<a href="http://world.huanqiu.com/roll/2010-03/748493_2.html">2</a> [<a href='http://world.huanqiu.com/roll/2010-03/748493_2.html'>下一页</a>]</div>
</div>
<!--_##contentnav##_--> 注:这行内容没有分页的文章没有
问题是这样的:
如果是没有分页的文章,采集内容代码选择从 <div id="text"> 到 </div>就行了如果是有分页的文章,内容采集代码开头可以是<div id="text">,但是结尾不知道该怎么处理了。因为这个网页的分页标签用了div开头,<div id="text">之后的第一个</div>之间是分页内容,不是文章内容。但是要用同一个规则即能采集无分页的文章,也能采集有分页的文章我就不知道该咋办了。如果是用<p class='fpage'>(*)</p>这样的我会处理。
所以还请大侠们指点一下,万分感谢! 没有大侠指点一下么 {:3_164:} 同等答案{:4_192:} 使用自定义连接 禁用系统连接
淘宝店冲3钻 全部小问题只需要1元钱联系QQ 1321993296
页:
[1]