火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2834|回复: 3

某标签的内容要从某网址的源码中采集,这样的标签应如何写

[复制链接]
发表于 2012-11-19 09:40:54 | 显示全部楼层 |阅读模式
最近采集一个音乐站,音乐的地址是用脚本生成的,
而该脚本可以在默认页获取得到,
获取了脚本地址,就可以从脚本中获得音乐地址,
可是我找了很久也没找到这样的获取规则
希望知道的教教我,谢谢了!!!
发表于 2012-11-19 11:29:07 | 显示全部楼层
你好。请用多页采集就行了。
发表于 2012-11-19 11:50:56 | 显示全部楼层
建议看下视频教程!http://bbs.locoy.com/spider-78318-1-1.html
发表于 2012-11-19 12:20:46 | 显示全部楼层
举例来说:假如默认页的源码是

  1. <script>
  2. ……
  3. ……
  4. musicid=3521445;
  5. ……
  6. </script>
复制代码
而实际的音乐网址为 http://www.yourdomain.com/music.php?id=3521445

这里,我们没办法通过前后截取前后字符串的方法获得音乐的目标链接,那么我们可以根据使用正则方法采集网址

这里可以插入1-9个 [参数] ,在后面的匹配中,可以使用[参数1] [参数2]……[参数9] 分别对应前面的依次顺序的[参数],了解正则知识,这些将会变得很简单。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-24 06:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表