火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3583|回复: 4

求采集这个网址数据的办法,急死了

[复制链接]
发表于 2015-7-11 15:04:58 | 显示全部楼层 |阅读模式
本帖最后由 abibas 于 2015-7-11 15:09 编辑

目标网站:http://www.renrendai.com/lend/detailPage.action?loanId=499964

采集目标:“审核状态”底下那个表格,即标签定义为审核的项目,返回审核结果:对勾或没有对勾

遇到的问题:直接用前后截取 正则 固定格式均无效。

猜测:将整个表格(前后截取<table>*</table>),截取下来的是一段代码,怀疑是JAVA程序(我是编程白痴,轻喷)
        
代码如下:

class="ui-table ui-table-blue ui-table-auditoria">
        <thead>
        <tr>
            <th width="30%"><span class="pl100">审核项目</span></th>
            <th width="27%"><span class="text-center">状态</span></th>
            <th><span class="text-right pr145">通过日期</span></th>
        </tr>
        </thead>
        <tbody>
        {{# each creditInfo }}
        <tr class="{{ itemStyle2 }}">
            <td>
                {{# if note }}
                <div class="ui-td-bg pl100"> {{ name }}({{{ note }}})</div>
                {{ else }}
                <div class="ui-td-bg pl100">{{name}}</div>
                {{/ if }}
            </td>
            <td class="text-center">
                <div class="ui-td-bg">
                    <i class="{{# if status }} icon icon-circle-{{ status }} {{/ if }}"></i>
                </div>
            </td>
            <td class="text-right">
                <div class="ui-td-bg pr145">{{# if date }} {{ date }} {{ else }} <span class="pr25">--</span>{{/ if }} </div>
            </td>
        </tr>
        {{ else }}
        <tr class="text-center">
            <td colspan="3" class="pt30 color-gray-text">{{# if _message }}{{ _message }}{{ else }}无审核状态{{/ if }}</td>
        </tr>
        {{/ each }}
        </tbody>
    < class="ui-table ui-table-blue ui-table-auditoria">


里头并没有我所发现的关键字:即信用报告 、收入验证、婚姻验证等等

但是用FIREBUG定位时,代码缺如下所示:

<thead><tr>
<th width="30%">
<span class="pl100">审核项目</span>


</th>

<th width="27%">
<span class="text-center">状态</span>


</th>

<th>
<span class="text-right pr145">通过日期</span>


</th>


</tr>


</thead>
<tbody>
<tr class="dark">
<td>
<div class="ui-td-bg pl100">信用报告</div>


</td>

<td class="text-center">
<div class="ui-td-bg">
<i class=" icon icon-circle-checked "></i>


</div>


</td>

<td class="text-right">


</tr>

<tr class="">
<td>
<div class="ui-td-bg pl100">身份认证</div>


</td>

<td class="text-center">
<div class="ui-td-bg">
<i class=" icon icon-circle-checked "></i>


</div>


</td>

<td class="text-right">


</tr>

可见内部包含我所要的关键词”信用报告“,身份验证等。

综上猜测我可能遇到了引用或者说链接问题。引用到了某个数据表格,无法直接爬出,担当浏览这一网页时,可以直接看到这一个表格的代码。

因此想问下大家,我这遇到的是什么问题?请给出个此类问题的关键字

非常着急,小白







发表于 2015-7-11 15:09:13 | 显示全部楼层
 楼主| 发表于 2015-7-11 15:11:31 | 显示全部楼层
303718 发表于 2015-7-11 15:09
相关教程http://faq.locoy.com/q-755.html

看上去是这样的问题!感谢大神!我先仔细研究研究
 楼主| 发表于 2015-7-11 15:26:37 | 显示全部楼层
303718 发表于 2015-7-11 15:09
相关教程http://faq.locoy.com/q-755.html

貌似仍然不对,符合条件的包,从TEXTview都是空的,并不包含我所需要的数据╮(╯_╰)╭
发表于 2015-7-13 11:51:10 | 显示全部楼层
你网站我看了`这个方式采集器如果抓不到隐藏网址~
用火车浏览器就可以了~http://www.locoyposter.com/
也可以去火车浏览器论坛提问http://bbs.locoyposter.com/forum.php
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-8 15:34

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表