这种分页规则怎么写?
<div class="page"><em>总共 24 条</em><a href="http://www.mm.net/wangluo/qingchunmm/20/3949_1.html" class="prev">上一页</a><strong>1</strong><a href="http://www.mm.net/zhiye/xuesheng/20/3950_2.html">2</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_3.html">3</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_4.html">4</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_5.html">5</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_6.html">6</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_7.html">7</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_8.html">8</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_9.html">9</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_10.html">10</a><a href="#">...</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_24.html">24</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_2.html" class="next">下一页</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_24.html" class="last">尾页</a><a href="http://bbs.meinv.com/" target="_blank" style="color:#FF0000;">我也要发布图片</a>
</div>
如果是从上一页到下一页按上下页模式采,能采到这个24页,但是他还会采直到采集最大限制,因为当到24页时,他还有下一页,连接是:3951_1.html 所以还会采,所以就这串代码应该是定位不好了! 有没有别的办法? 插件的话,能不能提供一下?
原地址是:http://www.mm.net/zhiye/xuesheng/20/3950_1.html 不需要使用插件,使用上下页模式设置分页采集区域,开始字符串:<div class="page">(*)</strong>
结束:</a>(*)class="next">下一页
采集结果如下:
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.mm.net/zhiye/xuesheng/20/3950_1.html
█2:http://www.mm.net/zhiye/xuesheng/20/3950_2.html
█3:http://www.mm.net/zhiye/xuesheng/20/3950_3.html
█4:http://www.mm.net/zhiye/xuesheng/20/3950_4.html
█5:http://www.mm.net/zhiye/xuesheng/20/3950_5.html
█6:http://www.mm.net/zhiye/xuesheng/20/3950_6.html
█7:http://www.mm.net/zhiye/xuesheng/20/3950_7.html
█8:http://www.mm.net/zhiye/xuesheng/20/3950_8.html
█9:http://www.mm.net/zhiye/xuesheng/20/3950_9.html
█10:http://www.mm.net/zhiye/xuesheng/20/3950_10.html
█11:http://www.mm.net/zhiye/xuesheng/20/3950_11.html
█12:http://www.mm.net/zhiye/xuesheng/20/3950_12.html
█13:http://www.mm.net/zhiye/xuesheng/20/3950_13.html
█14:http://www.mm.net/zhiye/xuesheng/20/3950_14.html
█15:http://www.mm.net/zhiye/xuesheng/20/3950_15.html
█16:http://www.mm.net/zhiye/xuesheng/20/3950_16.html
█17:http://www.mm.net/zhiye/xuesheng/20/3950_17.html
█18:http://www.mm.net/zhiye/xuesheng/20/3950_18.html
█19:http://www.mm.net/zhiye/xuesheng/20/3950_19.html
█20:http://www.mm.net/zhiye/xuesheng/20/3950_20.html
█21:http://www.mm.net/zhiye/xuesheng/20/3950_21.html
█22:http://www.mm.net/zhiye/xuesheng/20/3950_22.html
█23:http://www.mm.net/zhiye/xuesheng/20/3950_23.html
█24:http://www.mm.net/zhiye/xuesheng/20/3950_24.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配] 楼上的好人,
又有一个问题了: 怎么只采第一页的一张图片啊? 第二第三的不采了? 在下面一个文本框输入#p#
居然就可以了 结束:</a>(*)class="next">下一页
不是把后面的链接全删除了 开始字符串:<div class="page">(*)</strong>
才发现 这后面的</strong> 是多么重要 回复 2# wxl08
火车采集新手想问一下,这个开始和结束的界定,有什么规律可循吗? 这个方法好好啊.我也搞定了...
页:
[1]