这种分页规则怎么写？

sufin 发表于 2011-6-30 09:04:47

<div class="page">
<em>总共 24 条</em><a href="http://www.mm.net/wangluo/qingchunmm/20/3949_1.html" class="prev">上一页</a><strong>1</strong><a href="http://www.mm.net/zhiye/xuesheng/20/3950_2.html">2</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_3.html">3</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_4.html">4</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_5.html">5</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_6.html">6</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_7.html">7</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_8.html">8</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_9.html">9</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_10.html">10</a><a href="#">...</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_24.html">24</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_2.html" class="next">下一页</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_24.html" class="last">尾页</a><a href="http://bbs.meinv.com/" target="_blank" style="color:#FF0000;">我也要发布图片</a>
</div>

如果是从上一页到下一页按上下页模式采，能采到这个24页，但是他还会采直到采集最大限制，因为当到24页时，他还有下一页，连接是：3951_1.html 所以还会采，所以就这串代码应该是定位不好了！有没有别的办法？插件的话，能不能提供一下？

原地址是：http://www.mm.net/zhiye/xuesheng/20/3950_1.html

wxl08 发表于 2011-6-30 09:42:07

不需要使用插件，使用上下页模式设置分页采集区域，开始字符串：<div class="page">(*)</strong>
结束：</a>(*)class="next">下一页
采集结果如下：
████████████████████████████████████
█此页面包含多个分页：
█1:http://www.mm.net/zhiye/xuesheng/20/3950_1.html
█2:http://www.mm.net/zhiye/xuesheng/20/3950_2.html
█3:http://www.mm.net/zhiye/xuesheng/20/3950_3.html
█4:http://www.mm.net/zhiye/xuesheng/20/3950_4.html
█5:http://www.mm.net/zhiye/xuesheng/20/3950_5.html
█6:http://www.mm.net/zhiye/xuesheng/20/3950_6.html
█7:http://www.mm.net/zhiye/xuesheng/20/3950_7.html
█8:http://www.mm.net/zhiye/xuesheng/20/3950_8.html
█9:http://www.mm.net/zhiye/xuesheng/20/3950_9.html
█10:http://www.mm.net/zhiye/xuesheng/20/3950_10.html
█11:http://www.mm.net/zhiye/xuesheng/20/3950_11.html
█12:http://www.mm.net/zhiye/xuesheng/20/3950_12.html
█13:http://www.mm.net/zhiye/xuesheng/20/3950_13.html
█14:http://www.mm.net/zhiye/xuesheng/20/3950_14.html
█15:http://www.mm.net/zhiye/xuesheng/20/3950_15.html
█16:http://www.mm.net/zhiye/xuesheng/20/3950_16.html
█17:http://www.mm.net/zhiye/xuesheng/20/3950_17.html
█18:http://www.mm.net/zhiye/xuesheng/20/3950_18.html
█19:http://www.mm.net/zhiye/xuesheng/20/3950_19.html
█20:http://www.mm.net/zhiye/xuesheng/20/3950_20.html
█21:http://www.mm.net/zhiye/xuesheng/20/3950_21.html
█22:http://www.mm.net/zhiye/xuesheng/20/3950_22.html
█23:http://www.mm.net/zhiye/xuesheng/20/3950_23.html
█24:http://www.mm.net/zhiye/xuesheng/20/3950_24.html
█有分页匹配的标签，比如内容注意选中标签编辑框中的[该标签在分页中匹配]

sufin 发表于 2011-6-30 10:01:47

楼上的好人，
又有一个问题了：怎么只采第一页的一张图片啊？第二第三的不采了？

sufin 发表于 2011-6-30 10:21:16

在下面一个文本框输入#p#
居然就可以了

spes163 发表于 2011-7-13 13:59:31

结束：</a>(*)class="next">下一页
不是把后面的链接全删除了

spes163 发表于 2011-7-13 14:02:26

开始字符串：<div class="page">(*)</strong>
才发现这后面的</strong> 是多么重要

yang131261 发表于 2011-7-20 08:47:18

回复 2# wxl08

火车采集新手想问一下，这个开始和结束的界定，有什么规律可循吗？

dzz11 发表于 2011-9-10 15:29:04

这个方法好好啊．我也搞定了．．．

页: [1]

火车采集器软件交流官方论坛's Archiver

这种分页规则怎么写？