火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2808|回复: 9

初学者求帮助!

[复制链接]
发表于 2015-5-7 15:08:45 | 显示全部楼层 |阅读模式
我需要在人人贷网站上采集交易信息,但我用前后截取的方法采集信息时出现一个问题,就是很多信息的前后代码是一样的,比如说
<span class="tab-list-label mr30">公司行业</span>
                <span class="tab-list-value">教育/培训</span>
            </li>
            <li>
                <span class="tab-list-label mr30">收入范围</span>
             <span class="tab-list-value">2000-5000元</span>
            </li>
            <li>
                <span class="tab-list-label mr30">年&nbsp;&nbsp;&nbsp;&nbsp;龄</span>
                <span class="tab-list-value">31</span>
            </li>
            <li>
                <span class="tab-list-label mr30">公司规模</span>
                <span class="tab-list-value">100-500人</span>

这段中,我需要2000-5000元       31等   但是所需内容前面的<span class="tab-list-value"> 是不唯一的,我也试着将  >收入范围</span>
             <span class="tab-list-value">  作为前段截取的代码   ,可是测试时还是找不到所需的内容?



跪求大神帮助啊{:soso_e149:}
发表于 2015-5-7 16:56:42 | 显示全部楼层
联系我解决!
发表于 2015-5-7 17:02:47 | 显示全部楼层
正则提取
<li>(*)<span class="tab-list-label mr30">收入范围</span>(*)<span class="tab-list-value">[参数]</span>
标签内容[参数1]即可
发表于 2015-5-8 19:50:43 | 显示全部楼层
嘿嘿。。这个问题。。
发表于 2015-5-9 03:31:13 | 显示全部楼层
嘿嘿。。这个问题。。
发表于 2015-5-10 02:10:11 | 显示全部楼层
好像帮不上什么,百度看看吧!
发表于 2015-5-10 04:05:25 | 显示全部楼层
我无能为力咯!
 楼主| 发表于 2015-5-12 00:24:13 | 显示全部楼层
win322015 发表于 2015-5-7 17:02
正则提取
(*)收入范围(*)[参数]
标签内容[参数1]即可

谢谢您  不过我最后发现是因为没有获取cookies  
发表于 2015-5-12 01:57:07 | 显示全部楼层
我无能为力咯!
发表于 2015-5-12 07:11:08 | 显示全部楼层
嘿嘿。。这个问题。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 03:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表