某标签的内容要从某网址的源码中采集,这样的标签应如何写
最近采集一个音乐站,音乐的地址是用脚本生成的,而该脚本可以在默认页获取得到,
获取了脚本地址,就可以从脚本中获得音乐地址,
可是我找了很久也没找到这样的获取规则
希望知道的教教我,谢谢了!!! 你好。请用多页采集就行了。 建议看下视频教程!http://bbs.locoy.com/spider-78318-1-1.html 举例来说:假如默认页的源码是
<script>
……
……
musicid=3521445;
……
</script>
而实际的音乐网址为 http://www.yourdomain.com/music.php?id=3521445
这里,我们没办法通过前后截取前后字符串的方法获得音乐的目标链接,那么我们可以根据使用正则方法采集网址
这里可以插入1-9个 [参数] ,在后面的匹配中,可以使用[参数1] [参数2]……[参数9] 分别对应前面的依次顺序的[参数],了解正则知识,这些将会变得很简单。
页:
[1]