火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2816|回复: 3

如何采集可能有2种TAG标签的数据?

[复制链接]
发表于 2015-7-1 22:58:04 | 显示全部楼层 |阅读模式
一个求职网站,其中的发布人有两种标签

一种是注册用户,网站会显示他的注册名,标签为:shop-nameclass='shop-name'>用户名</a>,

一种是非注册用户,网站会自动给他取名,class='userinfo-name'>系统默认名称</a>


每个网页只显示上述2种标签中的一种。


现在我要采集这个网站的用户名,怎样判断如果有'shop-name'>标签就采集这个标签,如果有'userinfo-name'>标签则采集这个标签


我在正则里试了shop-nameclass='shop-name'>[参数]</a>是可以采集到注册用户的信息,shop-nameclass='shop-name'>[参数]</a>(*)class='userinfo-name'>[参数]</a>或者顺序倒过来就什么都采不到。


现在我用了变通的办法,就是增加了个标签名,但是看起来别扭,有办法实现一个标签名采集的功能吗?谢谢各位。


发表于 2015-7-2 07:51:03 | 显示全部楼层
用正则采集,相关教程http://faq.locoy.com/q-992.html
发表于 2015-7-2 09:01:57 | 显示全部楼层
网站有2种页面格式如何处理?楼上正解http://faq.locoy.com/q-992.html.多种就多设~
 楼主| 发表于 2015-7-2 22:23:44 | 显示全部楼层
303718 发表于 2015-7-2 07:51
用正则采集,相关教程http://faq.locoy.com/q-992.html

非常感谢,回头试试。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 04:53

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表