yunfeit 发表于 2012-11-19 09:40:54

某标签的内容要从某网址的源码中采集,这样的标签应如何写

最近采集一个音乐站,音乐的地址是用脚本生成的,
而该脚本可以在默认页获取得到,
获取了脚本地址,就可以从脚本中获得音乐地址,
可是我找了很久也没找到这样的获取规则
希望知道的教教我,谢谢了!!!

303718 发表于 2012-11-19 11:29:07

你好。请用多页采集就行了。

zml123 发表于 2012-11-19 11:50:56

建议看下视频教程!http://bbs.locoy.com/spider-78318-1-1.html

sushy 发表于 2012-11-19 12:20:46

举例来说:假如默认页的源码是
<script>
……
……
musicid=3521445;
……
</script>
而实际的音乐网址为 http://www.yourdomain.com/music.php?id=3521445

这里,我们没办法通过前后截取前后字符串的方法获得音乐的目标链接,那么我们可以根据使用正则方法采集网址

这里可以插入1-9个 [参数] ,在后面的匹配中,可以使用[参数1] [参数2]……[参数9] 分别对应前面的依次顺序的[参数],了解正则知识,这些将会变得很简单。

页: [1]
查看完整版本: 某标签的内容要从某网址的源码中采集,这样的标签应如何写