文章内容页里面的分页是 “下10页” 请问如何采集全部分页

25589 发表于 2009-6-5 19:40:31

http://www.lady8844.com/caizhuang/jnhz/2009-06-04/1244106129d253909.html

这个是文章的源地址我写的规则只能采集到“下10页”地址前面的所有分页，如何能采集到全部分页呢？

<div id="content_pagelist" style="text-align:right"><b></b> <a href='1244106129d253909_1.html'>2</a> <a href='1244106129d253909_2.html'>3</a> <a href='1244106129d253909_3.html'>4</a> <a href='1244106129d253909_4.html'>5</a> <a href='1244106129d253909_5.html'>6</a> <a href='1244106129d253909_6.html'>7</a> <a href='1244106129d253909_7.html'>8</a> <a href='1244106129d253909_8.html'>9</a> <a href='1244106129d253909_9.html'>10</a>  <b><a href='1244106129d253909_1.html' >下一页</a></b>  <b><a href='1244106129d253909_10.html' >下10页</a></b></div>

网页内点击下十页会打开新的网页，我编好了所属多页采集的可是就是不会设置

我编辑的所属多页采集：
正则匹配：下一页</a></b>  <b><a href='[参数]' >下
组合结果：[参数1]

请高手们指点一下，谢谢

kjmdiba 发表于 2009-6-5 21:03:11

为什么不用内容的循环匹配+分页代码

页: [1]

火车采集器软件交流官方论坛's Archiver

文章内容页里面的分页是 “下10页” 请问如何采集全部分页