文章内容页里面的分页是 “下10页” 请问如何采集全部分页
http://www.lady8844.com/caizhuang/jnhz/2009-06-04/1244106129d253909.html这个是文章的源地址我写的规则只能采集到“下10页”地址前面的所有分页,如何能采集到全部分页呢?
<div id="content_pagelist" style="text-align:right"><b></b> <a href='1244106129d253909_1.html'>2</a> <a href='1244106129d253909_2.html'>3</a> <a href='1244106129d253909_3.html'>4</a> <a href='1244106129d253909_4.html'>5</a> <a href='1244106129d253909_5.html'>6</a> <a href='1244106129d253909_6.html'>7</a> <a href='1244106129d253909_7.html'>8</a> <a href='1244106129d253909_8.html'>9</a> <a href='1244106129d253909_9.html'>10</a> <b><a href='1244106129d253909_1.html' >下一页</a></b> <b><a href='1244106129d253909_10.html' >下10页</a></b></div>
网页内点击下十页会打开新的网页 ,我编好了所属多页采集的 可是就是不会设置
我编辑的所属多页采集:
正则匹配:下一页</a></b> <b><a href='[参数]' >下
组合结果:[参数1]
请高手们指点一下,谢谢 为什么不用内容的循环匹配+分页代码
页:
[1]