采集js内容
内容页中要采集的内容是js生成的,用360火狐等浏览器可以看到 生成的内容<div class="play_videobox play_loading" id="View_video">
<iframe scrolling="no" frameborder="0" width="670" height="420" src="http://www.aiyuke.com/bztemplate/aiyuke/letv.html?add=a09e2a0a19&auto=1">
有内容
</iframe>
</div>
但是在采集内容页的时候 测试这个页面 火车头里边出现的源码没有上述内容,因为是js生成的
<div class="play_videobox play_loading" id="View_video">
这是空的
</div>
网页的源代码应该是这样的:
<div class="play_videobox play_loading" id="View_video">
<iframe scrolling="no" frameborder="0" width="670" height="420" src="http://www.aiyuke.com/bztemplate/aiyuke/letv.html?add=a09e2a0a19&auto=1">
有内容
</iframe>
</div>
<script type='text/javascript' src='http://imc.aiyuke.com/bztemplate/aiyuke/js/rel/video/video.js?150423fbed70.js' ></script> <script type="text/javascript">
$('#View_video').ayk_play({
url : [{"id":"8540","site":"letv","add":"a09e2a0a19","from":"\u7231\u7fbd\u5ba2","definition":"2","commentary":"2","duration":"4966.00","show_duration":"T1H22M46S","show_definition":"\u6807\u6e05","show_commentary":"\u82f1\u8bed"}],
width : 670,
height : 420,
domain : 'http://www.aiyuke.com/',
line : '0'
});
</script>
上述js生成的iframe 我该如何得到"http://www.aiyuke.com/bztemplate/aiyuke/letv.html?add=a09e2a0a19&auto=1" 也就是iframe中src的地址!!!! 抓包分析,查找数据所在真实地址,fiddler使用实例之----------查找隐藏的真实地址:http://bbs.locoy.com/spider-133138-1-1.html 混一下。。。 用多页模式采集 还是不是很明白 谢谢大家。其实我就是想得到
http://www.aiyuke.com/video_play/6932.html里边的视频播放地址 ,但是他是js生成的!! 请大家帮忙啊 都知道地址了还问个毛啊,关键,找到add":"a09e2a0a19",构造一个URL就行了 每次地址都不一样,怎么动态构造?有的是优酷播放的地址 ,有的是央视播放的地址! 联系我:(:(:(:(:(:(:( 已经使用插件解决
页:
[1]
2