分页采集顺序混乱如何解决?
分页代码如下:<div id="numpage">共9页。 <ahref="3628447.shtml" target="_self"><span>1</span></a> <ahref="3628447_1.shtml" target="_self">2</a> <ahref="3628447_2.shtml" target="_self">3</a> <ahref="3628447_3.shtml" target="_self">4</a> <ahref="3628447_4.shtml" target="_self">5</a> <ahref="3628447_5.shtml" target="_self">6</a> <a href="3628447_8.shtml" target="_self"><font face="Webdings">:</font></a></div>
█此页面包含多个分页:
█1:http://jiankang.nen.com.cn/jiankang/447/3628447.shtml
█2:http://jiankang.nen.com.cn/jiankang/447/3628447_1.shtml
█3:http://jiankang.nen.com.cn/jiankang/447/3628447_2.shtml
█4:http://jiankang.nen.com.cn/jiankang/447/3628447_3.shtml
█5:http://jiankang.nen.com.cn/jiankang/447/3628447_4.shtml
█6:http://jiankang.nen.com.cn/jiankang/447/3628447_5.shtml
█7:http://jiankang.nen.com.cn/jiankang/447/3628447_8.shtml
█8:http://jiankang.nen.com.cn/jiankang/447/3628447_6.shtml
█9:http://jiankang.nen.com.cn/jiankang/447/3628447_7.shtml
█有分页匹配的标签,比如内容注意选中标签编辑框中的
顺序颠倒了,如何解决? 本帖最后由 专业收费采集 于 2010-11-8 15:53 编辑
额 暂时没遇到过这种情况 标记下~
额 仔细看了下 她的第一页文章并没有把所有分页都写出来
看来需要用接口处理了~~~~~ 已解决,火车头没问题,是我思路不灵活. 已解决,火车头没问题,是我思路不灵活.
yerencao 发表于 2010-11-8 15:55 http://bbs.locoy.com/images/common/back.gif
额 你是解决的呢?能分享下下不 回复 4# 专业收费采集
在采集器的第二部内容采集的分页区域设置
开始字符串<span>(*)</span>
结束字符串</a>(*)</div> 把最后一个链接排除就可以了.在设置截止位置时 回复专业收费采集
在采集器的第二部内容采集的分页区域设置
开始字符串(*)
结束字符串(*)
wxl08 发表于 2010-11-8 17:23 http://bbs.locoy.com/images/common/back.gif
谢谢指点了 回复专业收费采集
在采集器的第二部内容采集的分页区域设置
开始字符串(*)
结束字符串(*)
wxl08 发表于 2010-11-8 17:23 http://bbs.locoy.com/images/common/back.gif
管理员 你这个方法我测试了下 好像不行哦~ 上下页模式:
从:<span>(*)</span>
到:<a href=(*)</font></a></div></div> 楼上正解啊~~~~~~~~~~~受教了呵呵
页:
[1]
2