火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4003|回复: 5

js里面的内容到底怎么采 给出实例 图文直播

[复制链接]
发表于 2008-9-3 17:59:29 | 显示全部楼层 |阅读模式
拿智联招聘 开刀,呵呵!








地址:http://jobs.zhaopin.com/P2/CC2061/8291/J900/000/CC206182916J90000003000.htm?f=ss


<div class="companyTitle"><script language="JavaScript" src="http://company.zhaopin.com/P2/CC2061/8291/CC206182916_Name_1.js"></script></div>
                <table cellpadding="0" cellspacing="0" border="0" class="companyInfoTab">
                <tr><td width="1%" nowrap="nowrap" valign="top">公司行业:</td>
                        <td><script language="JavaScript" src="http://company.zhaopin.com/P2/CC2061/8291/CC206182916_Industry_1.js"></script></td></tr>
                <tr><td width="1%" nowrap="nowrap">公司类型:</td>
                        <td><script language="JavaScript" src="http://company.zhaopin.com/P2/CC2061/8291/CC206182916_Type_1.js"></script></td></tr>
                <tr><td width="1%" nowrap="nowrap">公司规模:</td>
                        <td><script language="JavaScript" src="http://company.zhaopin.com/P2/CC2061/8291/CC206182916_Size_1.js">




大家注意,最上面的 公司名称  公司行业 公司类型  公司规模 全部都是JS[code]公司行业:



这段代码是他们的 JS


我的问题是,我们如何获得 JS嵌套的真实内容呢?能够采集到如图显示的内容呢?

[ 本帖最后由 xiongyujie37 于 2008-9-3 18:02 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2008-9-3 19:26:32 | 显示全部楼层
js的内容竟然只是
document.write ("500-999人");

根本谈上不加密...  把js采集下来截取括号内的内容就行了,论坛里搜索吧,有个js采集下载的补丁
 楼主| 发表于 2008-9-3 20:53:30 | 显示全部楼层
朋友  

还是这个页面,还是这个问题,头部和尾部都有一个大的嵌套 分别为


头部JS 地址

http://my.zhaopin.com/js/'+siteIDStr+'/head.js



尾部 JS 地址
http://my.zhaopin.com/js/'+siteIDStr+'/bottom.js

这样的链接,是无法访问,怎么采呢?
发表于 2008-9-3 20:55:14 | 显示全部楼层
哈哈。确是很剌手。
发表于 2008-9-3 22:33:22 | 显示全部楼层
var siteIDStr = 'zp';
if(domainStr.indexOf('.msn.')>-1) siteIDStr = 'msn';

var titleStr4Domain = (siteIDStr=='zp')?'职位搜索_智联招聘':'招聘_MSN中国';
document.title = document.title.replace('TitleStr4Domain',titleStr4Domain);
-->

把siteIDstr的值取出来
2008 php接口 这种地址怎么会取不到.

我没实际去做,只是理论。先忙自己的先
 楼主| 发表于 2008-9-3 22:47:30 | 显示全部楼层
正则表达式怎么写呢?困惑中。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-19 23:15

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表