初学者求帮助!
我需要在人人贷网站上采集交易信息,但我用前后截取的方法采集信息时出现一个问题,就是很多信息的前后代码是一样的,比如说<span class="tab-list-label mr30">公司行业</span>
<span class="tab-list-value">教育/培训</span>
</li>
<li>
<span class="tab-list-label mr30">收入范围</span>
<span class="tab-list-value">2000-5000元</span>
</li>
<li>
<span class="tab-list-label mr30">年 龄</span>
<span class="tab-list-value">31</span>
</li>
<li>
<span class="tab-list-label mr30">公司规模</span>
<span class="tab-list-value">100-500人</span>
这段中,我需要2000-5000元 31等 但是所需内容前面的<span class="tab-list-value"> 是不唯一的,我也试着将>收入范围</span>
<span class="tab-list-value">作为前段截取的代码 ,可是测试时还是找不到所需的内容?
跪求大神帮助啊{:soso_e149:} 联系我解决! 正则提取
<li>(*)<span class="tab-list-label mr30">收入范围</span>(*)<span class="tab-list-value">[参数]</span>
标签内容[参数1]即可 嘿嘿。。这个问题。。 嘿嘿。。这个问题。。 好像帮不上什么,百度看看吧! 我无能为力咯! win322015 发表于 2015-5-7 17:02
正则提取
(*)收入范围(*)[参数]
标签内容[参数1]即可
谢谢您不过我最后发现是因为没有获取cookies 我无能为力咯! 嘿嘿。。这个问题。。
页:
[1]