25589 发表于 2009-6-5 19:40:31

文章内容页里面的分页是 “下10页” 请问如何采集全部分页

http://www.lady8844.com/caizhuang/jnhz/2009-06-04/1244106129d253909.html

这个是文章的源地址我写的规则只能采集到“下10页”地址前面的所有分页,如何能采集到全部分页呢?

<div id="content_pagelist" style="text-align:right"><b></b>&nbsp;<a href='1244106129d253909_1.html'>2</a>&nbsp;<a href='1244106129d253909_2.html'>3</a>&nbsp;<a href='1244106129d253909_3.html'>4</a>&nbsp;<a href='1244106129d253909_4.html'>5</a>&nbsp;<a href='1244106129d253909_5.html'>6</a>&nbsp;<a href='1244106129d253909_6.html'>7</a>&nbsp;<a href='1244106129d253909_7.html'>8</a>&nbsp;<a href='1244106129d253909_8.html'>9</a>&nbsp;<a href='1244106129d253909_9.html'>10</a>&nbsp;&nbsp;<b><a href='1244106129d253909_1.html' >下一页</a></b>&nbsp;&nbsp;<b><a href='1244106129d253909_10.html' >下10页</a></b></div>


网页内点击下十页会打开新的网页 ,我编好了所属多页采集的 可是就是不会设置

我编辑的所属多页采集:
正则匹配:下一页</a></b>&nbsp;&nbsp;<b><a href='[参数]' >下
组合结果:[参数1]


请高手们指点一下,谢谢

kjmdiba 发表于 2009-6-5 21:03:11

为什么不用内容的循环匹配+分页代码
页: [1]
查看完整版本: 文章内容页里面的分页是 “下10页” 请问如何采集全部分页