hcwingswww 发表于 2014-9-22 16:50:29

火车头如何采集JS内的src链接

采集的网址是:http://www.968115.cn/search.action?bean.code=jgxqn&bean.whereList=ID&bean.whereList=40288a0241121a3101412580aeca00c3&bean.whereList=
想采集中间“提供服务”列表内的内容

看了一下源文件跳转代码为:<script type="text/javascript">
function removeDiv(){
        var div1 = document.getElementById("findimg");
        div1.style.display = "none";
        div1.style.visibility='hidden';
}
window.onload = function(){
        var url=window.location.search;
        var str   =   url.substr(1);
        strs = str.split("&");
        var id=unescape(strs.split("="));
        if(strs==null)
        {   
                document.getElementById("jg01n").src="/search.action?bean.code=jg01n&bean.whereList=ORG_ID&bean.whereList="+id+"&bean.whereList=";
        }
        else
        {
           var type=unescape(strs.split("="));
           document.getElementById("jg01n").src="/search.action?bean.code=jg01n&bean.whereList=ORG_ID&bean.whereList="+id+"&bean.whereList=&bean.whereList=SERVICE_NEW_TYPE1&bean.whereList="+type+"&bean.whereList=";       
        }
}
</script>




请问这个表格页怎么采集

303718 发表于 2014-9-22 18:40:12

这不是JS。真实连接在这里http://www.968115.cn/search.action?bean.code=jg01n&bean.whereList=ORG_ID&bean.whereList=40288a0241121a3101412580aeca00c3&bean.whereList=

hcwingswww 发表于 2014-9-23 15:47:37

本帖最后由 hcwingswww 于 2014-9-23 15:54 编辑

303718 发表于 2014-9-22 18:40 static/image/common/back.gif
这不是JS。真实连接在这里

感谢!可以请问一下怎么获取这个真实地址吗?

hcwingswww 发表于 2014-9-23 15:51:35

本帖最后由 hcwingswww 于 2014-9-23 16:04 编辑

303718 发表于 2014-9-22 18:40 static/image/common/back.gif
这不是JS。真实连接在这里

已了解,感谢您的帮助!
页: [1]
查看完整版本: 火车头如何采集JS内的src链接