ms6084681 发表于 2008-5-21 15:00:42

内容页分页采集问题

1.<p align="center"> <FONT style="COLOR: #ff0000"></font><a class=page href="085857769-2.html" target=_self></a><a class=page href="085857769-3.html" target=_self></a><a href="085857769-2.html"><img src="/News_Images/page_down.gif" border="0" alt="下一页" align="bottom"></A> </p>

问题:全部列出模式 自动识别分页   采回来的页面顺序变成1,3,2。是不是倒序发布的原因,不知道大家有没有碰到?

这个问题已经解决,是一些小的细节没注意到,谢谢沦陷今生

2.<p align="center"><p align="center"><img src="/News_Images/page_up.gif" border="0" alt="上一页" align="bottom"> <FONT style="COLOR: #ff0000"></font><a class=page href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=2" target=_self></a><a class=page href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=3" target=_self></a><a class=page href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=4" target=_self></a><a href="http://Search.xxx.com/Search/GRE/News.asp?Domain=GRE&NewsID=0772414002857273&PageNo=2"><img src="/News_Images/page_down.gif" border="0" alt="下一页" align="bottom"></a>

这种形式的分页貌似自动识别不了,不知怎样设置规则

[ 本帖最后由 ms6084681 于 2008-5-22 11:40 编辑 ]
页: [1]
查看完整版本: 内容页分页采集问题