火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 13981|回复: 12

关于标签循环匹配及标签在分页中匹配的功能使用

[复制链接]
发表于 2013-2-26 15:23:24 | 显示全部楼层 |阅读模式
本帖最后由 wxl08 于 2013-2-26 15:53 编辑

有很多用户不知道标签循环匹配及标签在分页中匹配这两个功能的使用,下面就以百度搜索列表采集为例,采集地址 http://www.baidu.com/s?wd=%E9%87 ... =32&inputT=3893,直接将这个列表页地址作为实际内容页采集,

查看源文件,得到每条记录标题所在的html代码格式是<h3 class="t">。。。。</h3>,所以在采集标题时规则设置如下

勾选截图中的该标签在循环中匹配,这样就可以循环采集到每条记录的标签,采集内容标签规则设置如下,一样需要设置循环匹配,
,这个列表的分页需要在第二步分页设置中截取到分页连接地址,
分页规则设置好后,勾选每个标签里的该标签在分页中匹配选项,
如果需要将采集的数据一条条保存,需要选择添加新纪录方式,
最后测试效果如下:

参考规则
有的用户需要获取内容页地址或者内容地址中部分参数这就需要使用从网址中采集功能,然后使用正则采集,

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2013-2-28 15:26:39 | 显示全部楼层
真是太感谢了!!!!!!!!!
发表于 2013-3-11 18:53:59 | 显示全部楼层
循环效果不错的。。。。真的。
发表于 2013-5-17 14:05:38 | 显示全部楼层
没用过这功能,学习一下{:soso_e100:}
发表于 2013-5-24 17:36:17 | 显示全部楼层
太感谢了。。。。。。。。
发表于 2013-11-13 16:39:25 | 显示全部楼层
很有用,我还想进一步问一下,怎么样循环采集所有分页的标题和内容呢,因为我试验了这个例子,采集到的只是当前页面的标题和内容。还请大牛进一步讲解一下!万分感谢!
发表于 2013-11-28 20:49:02 | 显示全部楼层
循环,针对一页多标题,分页也需要循环
发表于 2014-4-17 12:15:29 | 显示全部楼层
一起交流,感觉真不错
发表于 2014-6-11 09:07:59 | 显示全部楼层
这个设置很麻烦的
发表于 2014-11-13 20:36:57 | 显示全部楼层
循环匹配一直没搞 懂,为啥不能单独一个标签循环呢
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 23:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表