sovereign000 发表于 2015-4-29 14:56:28

采集js内容

    内容页中要采集的内容是js生成的,用360火狐等浏览器可以看到 生成的内容
<div class="play_videobox play_loading" id="View_video">
<iframe scrolling="no" frameborder="0" width="670" height="420" src="http://www.aiyuke.com/bztemplate/aiyuke/letv.html?add=a09e2a0a19&amp;auto=1">
有内容
</iframe>
   </div>
但是在采集内容页的时候 测试这个页面 火车头里边出现的源码没有上述内容,因为是js生成的

<div class="play_videobox play_loading" id="View_video">
            这是空的
                </div>

网页的源代码应该是这样的:

<div class="play_videobox play_loading" id="View_video">
<iframe scrolling="no" frameborder="0" width="670" height="420" src="http://www.aiyuke.com/bztemplate/aiyuke/letv.html?add=a09e2a0a19&amp;auto=1">
有内容
</iframe>
   </div>

<script type='text/javascript' src='http://imc.aiyuke.com/bztemplate/aiyuke/js/rel/video/video.js?150423fbed70.js' ></script>                <script type="text/javascript">
$('#View_video').ayk_play({
url        :        [{"id":"8540","site":"letv","add":"a09e2a0a19","from":"\u7231\u7fbd\u5ba2","definition":"2","commentary":"2","duration":"4966.00","show_duration":"T1H22M46S","show_definition":"\u6807\u6e05","show_commentary":"\u82f1\u8bed"}],
width        :        670,
height        :        420,
domain        :        'http://www.aiyuke.com/',
line        :        '0'
});
</script>
上述js生成的iframe 我该如何得到"http://www.aiyuke.com/bztemplate/aiyuke/letv.html?add=a09e2a0a19&amp;auto=1" 也就是iframe中src的地址!!!!

黄毛丫头 发表于 2015-4-29 15:42:25

抓包分析,查找数据所在真实地址,fiddler使用实例之----------查找隐藏的真实地址:http://bbs.locoy.com/spider-133138-1-1.html

thshj 发表于 2015-4-29 20:24:15

混一下。。。

303718 发表于 2015-4-30 08:59:29

用多页模式采集

sovereign000 发表于 2015-4-30 09:30:16

还是不是很明白 谢谢大家。其实我就是想得到
http://www.aiyuke.com/video_play/6932.html里边的视频播放地址 ,但是他是js生成的!!

sovereign000 发表于 2015-4-30 11:14:11

请大家帮忙啊

vvzz 发表于 2015-4-30 13:16:22

都知道地址了还问个毛啊,关键,找到add":"a09e2a0a19",构造一个URL就行了

sovereign000 发表于 2015-5-4 10:32:38

每次地址都不一样,怎么动态构造?有的是优酷播放的地址 ,有的是央视播放的地址!

qqchunchun 发表于 2015-5-5 19:42:29

联系我:(:(:(:(:(:(:(

sovereign000 发表于 2015-5-6 16:03:01

已经使用插件解决
页: [1] 2
查看完整版本: 采集js内容