求采集这个网址数据的办法,急死了
本帖最后由 abibas 于 2015-7-11 15:09 编辑目标网站:http://www.renrendai.com/lend/detailPage.action?loanId=499964
采集目标:“审核状态”底下那个表格,即标签定义为审核的项目,返回审核结果:对勾或没有对勾
遇到的问题:直接用前后截取 正则 固定格式均无效。
猜测:将整个表格(前后截取<table>*</table>),截取下来的是一段代码,怀疑是JAVA程序(我是编程白痴,轻喷)
代码如下:
class="ui-table ui-table-blue ui-table-auditoria">
<thead>
<tr>
<th width="30%"><span class="pl100">审核项目</span></th>
<th width="27%"><span class="text-center">状态</span></th>
<th><span class="text-right pr145">通过日期</span></th>
</tr>
</thead>
<tbody>
{{# each creditInfo }}
<tr class="{{ itemStyle2 }}">
<td>
{{# if note }}
<div class="ui-td-bg pl100"> {{ name }}({{{ note }}})</div>
{{ else }}
<div class="ui-td-bg pl100">{{name}}</div>
{{/ if }}
</td>
<td class="text-center">
<div class="ui-td-bg">
<i class="{{# if status }} icon icon-circle-{{ status }} {{/ if }}"></i>
</div>
</td>
<td class="text-right">
<div class="ui-td-bg pr145">{{# if date }} {{ date }} {{ else }} <span class="pr25">--</span>{{/ if }} </div>
</td>
</tr>
{{ else }}
<tr class="text-center">
<td colspan="3" class="pt30 color-gray-text">{{# if _message }}{{ _message }}{{ else }}无审核状态{{/ if }}</td>
</tr>
{{/ each }}
</tbody>
< class="ui-table ui-table-blue ui-table-auditoria">
里头并没有我所发现的关键字:即信用报告 、收入验证、婚姻验证等等
但是用FIREBUG定位时,代码缺如下所示:
<thead><tr>
<th width="30%">
<span class="pl100">审核项目</span>
</th>
<th width="27%">
<span class="text-center">状态</span>
</th>
<th>
<span class="text-right pr145">通过日期</span>
</th>
</tr>
</thead>
<tbody>
<tr class="dark">
<td>
<div class="ui-td-bg pl100">信用报告</div>
</td>
<td class="text-center">
<div class="ui-td-bg">
<i class=" icon icon-circle-checked "></i>
</div>
</td>
<td class="text-right">
</tr>
<tr class="">
<td>
<div class="ui-td-bg pl100">身份认证</div>
</td>
<td class="text-center">
<div class="ui-td-bg">
<i class=" icon icon-circle-checked "></i>
</div>
</td>
<td class="text-right">
</tr>
可见内部包含我所要的关键词”信用报告“,身份验证等。
综上猜测我可能遇到了引用或者说链接问题。引用到了某个数据表格,无法直接爬出,担当浏览这一网页时,可以直接看到这一个表格的代码。
因此想问下大家,我这遇到的是什么问题?请给出个此类问题的关键字
非常着急,小白
相关教程http://faq.locoy.com/q-755.html 303718 发表于 2015-7-11 15:09
相关教程http://faq.locoy.com/q-755.html
看上去是这样的问题!感谢大神!我先仔细研究研究 303718 发表于 2015-7-11 15:09
相关教程http://faq.locoy.com/q-755.html
貌似仍然不对,符合条件的包,从TEXTview都是空的,并不包含我所需要的数据╮(╯_╰)╭:( 你网站我看了`这个方式采集器如果抓不到隐藏网址~
用火车浏览器就可以了~http://www.locoyposter.com/
也可以去火车浏览器论坛提问http://bbs.locoyposter.com/forum.php
页:
[1]