yerencao 发表于 2010-11-8 15:39:29

分页采集顺序混乱如何解决?

分页代码如下:
<div id="numpage">共9页。 <ahref="3628447.shtml" target="_self"><span>1</span></a> <ahref="3628447_1.shtml" target="_self">2</a> <ahref="3628447_2.shtml" target="_self">3</a> <ahref="3628447_3.shtml" target="_self">4</a> <ahref="3628447_4.shtml" target="_self">5</a> <ahref="3628447_5.shtml" target="_self">6</a> <a href="3628447_8.shtml" target="_self"><font face="Webdings">:</font></a></div>

█此页面包含多个分页:
█1:http://jiankang.nen.com.cn/jiankang/447/3628447.shtml
█2:http://jiankang.nen.com.cn/jiankang/447/3628447_1.shtml
█3:http://jiankang.nen.com.cn/jiankang/447/3628447_2.shtml
█4:http://jiankang.nen.com.cn/jiankang/447/3628447_3.shtml
█5:http://jiankang.nen.com.cn/jiankang/447/3628447_4.shtml
█6:http://jiankang.nen.com.cn/jiankang/447/3628447_5.shtml
█7:http://jiankang.nen.com.cn/jiankang/447/3628447_8.shtml
█8:http://jiankang.nen.com.cn/jiankang/447/3628447_6.shtml
█9:http://jiankang.nen.com.cn/jiankang/447/3628447_7.shtml
█有分页匹配的标签,比如内容注意选中标签编辑框中的

顺序颠倒了,如何解决?

专业收费采集 发表于 2010-11-8 15:48:03

本帖最后由 专业收费采集 于 2010-11-8 15:53 编辑

额 暂时没遇到过这种情况 标记下~

额 仔细看了下 她的第一页文章并没有把所有分页都写出来

看来需要用接口处理了~~~~~

yerencao 发表于 2010-11-8 15:55:58

已解决,火车头没问题,是我思路不灵活.

专业收费采集 发表于 2010-11-8 16:24:04

已解决,火车头没问题,是我思路不灵活.
yerencao 发表于 2010-11-8 15:55 http://bbs.locoy.com/images/common/back.gif

额 你是解决的呢?能分享下下不

wxl08 发表于 2010-11-8 17:23:05

回复 4# 专业收费采集

在采集器的第二部内容采集的分页区域设置
开始字符串<span>(*)</span>
结束字符串</a>(*)</div>

yerencao 发表于 2010-11-8 17:35:39

把最后一个链接排除就可以了.在设置截止位置时

专业收费采集 发表于 2010-11-8 19:43:27

回复专业收费采集

在采集器的第二部内容采集的分页区域设置
开始字符串(*)
结束字符串(*)
wxl08 发表于 2010-11-8 17:23 http://bbs.locoy.com/images/common/back.gif


谢谢指点了

专业收费采集 发表于 2010-11-8 20:43:51

回复专业收费采集

在采集器的第二部内容采集的分页区域设置
开始字符串(*)
结束字符串(*)
wxl08 发表于 2010-11-8 17:23 http://bbs.locoy.com/images/common/back.gif


管理员 你这个方法我测试了下 好像不行哦~

特淘淘 发表于 2010-11-9 00:13:20

上下页模式:
从:<span>(*)</span>
到:<a href=(*)</font></a></div></div>

专业收费采集 发表于 2010-11-9 09:23:22

楼上正解啊~~~~~~~~~~~受教了呵呵
页: [1] 2
查看完整版本: 分页采集顺序混乱如何解决?