火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2773|回复: 0

内容页分页采集问题

[复制链接]
发表于 2008-5-21 15:00:42 | 显示全部楼层 |阅读模式
1.<p align="center"> <FONT style="COLOR: #ff0000">[1]</font>  <a class=page href="085857769-2.html" target=_self>[2]</a>  <a class=page href="085857769-3.html" target=_self>[3]</a>  <a href="085857769-2.html"><img src="/News_Images/page_down.gif" border="0" alt="下一页" align="bottom"></A> </p>

问题:全部列出模式 自动识别分页   采回来的页面顺序变成1,3,2。是不是倒序发布的原因,不知道大家有没有碰到?

这个问题已经解决,是一些小的细节没注意到,谢谢沦陷今生

2.<p align="center"><p align="center"><img src="/News_Images/page_up.gif" border="0" alt="上一页" align="bottom"> <FONT style="COLOR: #ff0000">[1]</font>  <a class=page href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=2" target=_self>[2]</a>  <a class=page href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=3" target=_self>[3]</a>  <a class=page href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=4" target=_self>[4]</a>  <a href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=2"><img src="/News_Images/page_down.gif" border="0" alt="下一页" align="bottom"></a>

这种形式的分页貌似自动识别不了,不知怎样设置规则

[ 本帖最后由 ms6084681 于 2008-5-22 11:40 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-22 15:40

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表