找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2672|回复: 7

这种分页规则怎么写?

[复制链接]
发表于 2011-6-30 09:04:47 | 显示全部楼层 |阅读模式
<div class="page">
                        <em>总共&nbsp;24&nbsp;条</em><a href="http://www.mm.net/wangluo/qingchunmm/20/3949_1.html" class="prev">上一页</a><strong>1</strong><a href="http://www.mm.net/zhiye/xuesheng/20/3950_2.html">2</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_3.html">3</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_4.html">4</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_5.html">5</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_6.html">6</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_7.html">7</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_8.html">8</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_9.html">9</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_10.html">10</a><a href="#">...</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_24.html">24</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_2.html" class="next">下一页</a><a href="http://www.mm.net/zhiye/xuesheng/20/3950_24.html" class="last">尾页</a><a href="http://bbs.meinv.com/" target="_blank" style="color:#FF0000;">我也要发布图片</a>
                      </div>

如果是从上一页到下一页按上下页模式采,能采到这个24页,但是他还会采直到采集最大限制,因为当到24页时,他还有下一页,连接是:3951_1.html 所以还会采,所以就这串代码应该是定位不好了! 有没有别的办法? 插件的话,能不能提供一下?

原地址是:http://www.mm.net/zhiye/xuesheng/20/3950_1.html
发表于 2011-6-30 09:42:07 | 显示全部楼层
不需要使用插件,使用上下页模式设置分页采集区域,开始字符串:<div class="page">(*)</strong>
结束:</a>(*)class="next">下一页
采集结果如下:
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.mm.net/zhiye/xuesheng/20/3950_1.html
█2:http://www.mm.net/zhiye/xuesheng/20/3950_2.html
█3:http://www.mm.net/zhiye/xuesheng/20/3950_3.html
█4:http://www.mm.net/zhiye/xuesheng/20/3950_4.html
█5:http://www.mm.net/zhiye/xuesheng/20/3950_5.html
█6:http://www.mm.net/zhiye/xuesheng/20/3950_6.html
█7:http://www.mm.net/zhiye/xuesheng/20/3950_7.html
█8:http://www.mm.net/zhiye/xuesheng/20/3950_8.html
█9:http://www.mm.net/zhiye/xuesheng/20/3950_9.html
█10:http://www.mm.net/zhiye/xuesheng/20/3950_10.html
█11:http://www.mm.net/zhiye/xuesheng/20/3950_11.html
█12:http://www.mm.net/zhiye/xuesheng/20/3950_12.html
█13:http://www.mm.net/zhiye/xuesheng/20/3950_13.html
█14:http://www.mm.net/zhiye/xuesheng/20/3950_14.html
█15:http://www.mm.net/zhiye/xuesheng/20/3950_15.html
█16:http://www.mm.net/zhiye/xuesheng/20/3950_16.html
█17:http://www.mm.net/zhiye/xuesheng/20/3950_17.html
█18:http://www.mm.net/zhiye/xuesheng/20/3950_18.html
█19:http://www.mm.net/zhiye/xuesheng/20/3950_19.html
█20:http://www.mm.net/zhiye/xuesheng/20/3950_20.html
█21:http://www.mm.net/zhiye/xuesheng/20/3950_21.html
█22:http://www.mm.net/zhiye/xuesheng/20/3950_22.html
█23:http://www.mm.net/zhiye/xuesheng/20/3950_23.html
█24:http://www.mm.net/zhiye/xuesheng/20/3950_24.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
 楼主| 发表于 2011-6-30 10:01:47 | 显示全部楼层
楼上的好人,
又有一个问题了: 怎么只采第一页的一张图片啊? 第二第三的不采了?
 楼主| 发表于 2011-6-30 10:21:16 | 显示全部楼层
在下面一个文本框输入#p#
居然就可以了
发表于 2011-7-13 13:59:31 | 显示全部楼层
结束:</a>(*)class="next">下一页
不是把后面的链接全删除了
发表于 2011-7-13 14:02:26 | 显示全部楼层
开始字符串:<div class="page">(*)</strong>
才发现 这后面的</strong> 是多么重要
发表于 2011-7-20 08:47:18 | 显示全部楼层
回复 2# wxl08


火车采集新手想问一下,这个开始和结束的界定,有什么规律可循吗?
发表于 2011-9-10 15:29:04 | 显示全部楼层
这个方法好好啊.我也搞定了...
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表