wanghuiyuan94 发表于 2015-5-7 15:08:45

初学者求帮助!

我需要在人人贷网站上采集交易信息,但我用前后截取的方法采集信息时出现一个问题,就是很多信息的前后代码是一样的,比如说
<span class="tab-list-label mr30">公司行业</span>
                <span class="tab-list-value">教育/培训</span>
            </li>
            <li>
                <span class="tab-list-label mr30">收入范围</span>
             <span class="tab-list-value">2000-5000元</span>
            </li>
            <li>
                <span class="tab-list-label mr30">年&nbsp;&nbsp;&nbsp;&nbsp;龄</span>
                <span class="tab-list-value">31</span>
            </li>
            <li>
                <span class="tab-list-label mr30">公司规模</span>
                <span class="tab-list-value">100-500人</span>

这段中,我需要2000-5000元       31等   但是所需内容前面的<span class="tab-list-value"> 是不唯一的,我也试着将>收入范围</span>
             <span class="tab-list-value">作为前段截取的代码   ,可是测试时还是找不到所需的内容?



跪求大神帮助啊{:soso_e149:}

qqchunchun 发表于 2015-5-7 16:56:42

联系我解决!

win322015 发表于 2015-5-7 17:02:47

正则提取
<li>(*)<span class="tab-list-label mr30">收入范围</span>(*)<span class="tab-list-value">[参数]</span>
标签内容[参数1]即可

mhtimefa 发表于 2015-5-8 19:50:43

嘿嘿。。这个问题。。

c21211 发表于 2015-5-9 03:31:13

嘿嘿。。这个问题。。

ygh2318596 发表于 2015-5-10 02:10:11

好像帮不上什么,百度看看吧!

erasdfasdf 发表于 2015-5-10 04:05:25

我无能为力咯!

wanghuiyuan94 发表于 2015-5-12 00:24:13

win322015 发表于 2015-5-7 17:02
正则提取
(*)收入范围(*)[参数]
标签内容[参数1]即可

谢谢您不过我最后发现是因为没有获取cookies

huitenedu 发表于 2015-5-12 01:57:07

我无能为力咯!

myairway 发表于 2015-5-12 07:11:08

嘿嘿。。这个问题。。
页: [1]
查看完整版本: 初学者求帮助!