火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5954|回复: 10

分页采集顺序混乱如何解决?

[复制链接]
发表于 2010-11-8 15:39:29 | 显示全部楼层 |阅读模式
分页代码如下:
<div id="numpage">共9页。 <a  href="3628447.shtml" target="_self"><span>1</span></a> <a  href="3628447_1.shtml" target="_self">2</a> <a  href="3628447_2.shtml" target="_self">3</a> <a  href="3628447_3.shtml" target="_self">4</a> <a  href="3628447_4.shtml" target="_self">5</a> <a  href="3628447_5.shtml" target="_self">6</a> <a href="3628447_8.shtml" target="_self"><font face="Webdings">:</font></a></div>

█此页面包含多个分页:
█1:http://jiankang.nen.com.cn/jiankang/447/3628447.shtml
█2:http://jiankang.nen.com.cn/jiankang/447/3628447_1.shtml
█3:http://jiankang.nen.com.cn/jiankang/447/3628447_2.shtml
█4:http://jiankang.nen.com.cn/jiankang/447/3628447_3.shtml
█5:http://jiankang.nen.com.cn/jiankang/447/3628447_4.shtml
█6:http://jiankang.nen.com.cn/jiankang/447/3628447_5.shtml
█7:http://jiankang.nen.com.cn/jiankang/447/3628447_8.shtml
█8:http://jiankang.nen.com.cn/jiankang/447/3628447_6.shtml
█9:http://jiankang.nen.com.cn/jiankang/447/3628447_7.shtml
█有分页匹配的标签,比如内容注意选中标签编辑框中的

顺序颠倒了,如何解决?
发表于 2010-11-8 15:48:03 | 显示全部楼层
本帖最后由 专业收费采集 于 2010-11-8 15:53 编辑

额 暂时没遇到过这种情况 标记下~

额 仔细看了下 她的第一页文章并没有把所有分页都写出来

看来需要用接口处理了~~~~~
 楼主| 发表于 2010-11-8 15:55:58 | 显示全部楼层
已解决,火车头没问题,是我思路不灵活.
发表于 2010-11-8 16:24:04 | 显示全部楼层
已解决,火车头没问题,是我思路不灵活.
yerencao 发表于 2010-11-8 15:55


额 你是解决的呢?能分享下下不
发表于 2010-11-8 17:23:05 | 显示全部楼层
回复 4# 专业收费采集

在采集器的第二部内容采集的分页区域设置
开始字符串<span>(*)</span>
结束字符串</a>(*)</div>
 楼主| 发表于 2010-11-8 17:35:39 | 显示全部楼层
把最后一个链接排除就可以了.在设置截止位置时
发表于 2010-11-8 19:43:27 | 显示全部楼层
回复  专业收费采集

在采集器的第二部内容采集的分页区域设置
开始字符串(*)
结束字符串(*)
wxl08 发表于 2010-11-8 17:23



谢谢指点了
发表于 2010-11-8 20:43:51 | 显示全部楼层
回复  专业收费采集

在采集器的第二部内容采集的分页区域设置
开始字符串(*)
结束字符串(*)
wxl08 发表于 2010-11-8 17:23



管理员 你这个方法我测试了下 好像不行哦~
发表于 2010-11-9 00:13:20 | 显示全部楼层
上下页模式:
从:<span>(*)</span>
到:<a href=(*)</font></a></div></div>
发表于 2010-11-9 09:23:22 | 显示全部楼层
楼上正解啊~~~~~~~~~~~受教了呵呵
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-12 19:52

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表