charistain 发表于 2012-12-13 20:49:49

多页采集中的多页网址获取怎么只能获取到一条啊

比如我要采集http://www.huaxi100.com/forum-541-1.html中的所有帖子的链接地址
在多页中选择从当前源代码中获取:
查看源码中主题对应的源码
<aonclick="atarget(this)" class="xst" >一人吸烟,贻害全家,烟民清醒下了吧~~~~</a>
<astyle="font-weight: bold;color: #EE5023" onclick="atarget(this)" class="xst" >【辣妈Q宝】银杏小麻豆征集令来咯!粑粑麻麻快来报名!</a>

获取的正则表达式为:
<a href="http://www.huaxi100.com/thread-[参数]-1-1.html" (*) >(*)</a>
组合结果为:http://www.huaxi100.com/thread-[参数1]-1-1.html
每次都只能采集到一个帖子的地址,不知道是什么原因,请哪位帮忙看看谢谢
如:获取到的多页地址为http://www.huaxi100.com/thread-1826098-1-1.html

rq204 发表于 2012-12-14 09:41:17

您可以将您的规则修改一下。如 <a href="http://www.huaxi100.com/thread-[参数]-

wxl08 发表于 2012-12-14 11:38:24

多页规则配置不能循环匹配的,一次只能获取一条网址

foxbold31 发表于 2013-8-25 16:19:48

要求增加多页循环功能.
页: [1]
查看完整版本: 多页采集中的多页网址获取怎么只能获取到一条啊