wxl08 发表于 2013-2-26 15:23:24

关于标签循环匹配及标签在分页中匹配的功能使用

本帖最后由 wxl08 于 2013-2-26 15:53 编辑

有很多用户不知道标签循环匹配及标签在分页中匹配这两个功能的使用,下面就以百度搜索列表采集为例,采集地址 http://www.baidu.com/s?wd=%E9%87%87%E9%9B%86%E5%99%A8&rsv_bp=0&ch=&tn=baidu&bar=&rsv_spt=3&ie=utf-8&rsv_sug3=1&rsv_sug=0&rsv_sug1=1&rsv_sug4=32&inputT=3893,直接将这个列表页地址作为实际内容页采集,

查看源文件,得到每条记录标题所在的html代码格式是<h3 class="t">。。。。</h3>,所以在采集标题时规则设置如下

勾选截图中的该标签在循环中匹配,这样就可以循环采集到每条记录的标签,采集内容标签规则设置如下,一样需要设置循环匹配,
,这个列表的分页需要在第二步分页设置中截取到分页连接地址,
分页规则设置好后,勾选每个标签里的该标签在分页中匹配选项,
如果需要将采集的数据一条条保存,需要选择添加新纪录方式,
最后测试效果如下:

参考规则
有的用户需要获取内容页地址或者内容地址中部分参数这就需要使用从网址中采集功能,然后使用正则采集,

游侠浪子 发表于 2013-2-28 15:26:39

真是太感谢了!!!!!!!!!

新人long新 发表于 2013-3-11 18:53:59

循环效果不错的。。。。真的。

江南0920 发表于 2013-5-17 14:05:38

没用过这功能,学习一下{:soso_e100:}

江南0920 发表于 2013-5-24 17:36:17

太感谢了。。。。。。。。

irischen 发表于 2013-11-13 16:39:25

很有用,我还想进一步问一下,怎么样循环采集所有分页的标题和内容呢,因为我试验了这个例子,采集到的只是当前页面的标题和内容。还请大牛进一步讲解一下!万分感谢!

worldboyy 发表于 2013-11-28 20:49:02

循环,针对一页多标题,分页也需要循环

我是武大郎 发表于 2014-4-17 12:15:29

一起交流,感觉真不错

www.52gzj.cc 发表于 2014-6-11 09:07:59

这个设置很麻烦的

rhkipjtg 发表于 2014-11-13 20:36:57

循环匹配一直没搞 懂,为啥不能单独一个标签循环呢
页: [1] 2
查看完整版本: 关于标签循环匹配及标签在分页中匹配的功能使用