火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2231|回复: 3

求助文章分页的内容怎么采集?

[复制链接]
发表于 2010-3-18 15:41:14 | 显示全部楼层 |阅读模式
本帖最后由 lunacory 于 2010-3-18 15:44 编辑

这个是没有分页的内容代码:
网址:http://world.huanqiu.com/roll/2010-03/748771.html     
<div id="text">
         <!--中间这里是文本内容-->
</div>
这个是有分页的内容代码:
网址:http://world.huanqiu.com/roll/2010-03/748493.html  
<div id="text">                                                                  
<div class="contentpage"> 1  <a href="http://world.huanqiu.com/roll/2010-03/748493_2.html">2</a> [<a href='http://world.huanqiu.com/roll/2010-03/748493_2.html'>下一页</a>]</div>
<!--中间是文本内容-->
<div class="contentpage"> 1  <a href="http://world.huanqiu.com/roll/2010-03/748493_2.html">2</a> [<a href='http://world.huanqiu.com/roll/2010-03/748493_2.html'>下一页</a>]</div>                           
   </div>
<!--_##contentnav##_-->   注:这行内容没有分页的文章没有


问题是这样的:
如果是没有分页的文章,采集内容代码选择从       <div id="text">         </div>就行了如果是有分页的文章,内容采集代码开头可以是<div id="text">,但是结尾不知道该怎么处理了。因为这个网页的分页标签用了div开头,<div id="text">之后的第一个</div>之间是分页内容,不是文章内容。但是要用同一个规则即能采集无分页的文章,也能采集有分页的文章我就不知道该咋办了。如果是用<p class='fpage'>(*)</p>这样的我会处理。

所以还请大侠们指点一下,万分感谢!
 楼主| 发表于 2010-3-19 01:40:48 | 显示全部楼层
没有大侠指点一下么
发表于 2010-3-19 08:46:26 | 显示全部楼层
同等答案
发表于 2010-3-19 12:00:37 | 显示全部楼层
使用自定义连接 禁用系统连接
淘宝店冲3钻 全部小问题只需要1元钱  联系QQ 1321993296
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-14 04:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表