火车采集器是不是不能采集2级连接的网站?
像http://www.ah930.com.cn/这样的电影网站,它的动作片列表第一页是http://www.ah930.com.cn/list/6_1.html,
像《保持缄默》这部电影
影片介绍页面是http://www.ah930.com.cn/movie/3311.html
而这部片子有上下二集,所以它有两个影片播放页面,
影片上集播放页面是http://www.ah930.com/index/play.php?urlid=27117&movid=3311&num=1&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124
影片下集播放页面是http://www.ah930.com/index/play.php?urlid=27118&movid=3311&num=2&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124
它的影片真实链接地址都是放在播放页面的,
像这种多页面多级链接的网站,火车采集器把它们的影片地址采集下来吗?
如果不可以,请管理员或版主告知一下,我弄了好几天了,一直都没有成功,如果不可以采集的话,也不想再烦了
如果可以采集的话,望告知一下应该怎样设置,
先谢谢了 如果使用一级的方法是可以采到的,那么二级也是可以的 这个站已经不是两级.
影片上集播放页面是http://www.ah930.com/index/play.php?urlid=27117&movid=3311&num=1&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124
影片下集播放页面是http://www.ah930.com/index/play.php?urlid=27118&movid=3311&num=2&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124
这两个地址.在源码里看不到.用的是调用.
<div class="movienews3b">
<script src="../index/playurl.php?id=3311&num=10"></script>
从起始地址到要采集的视频地址.一共有4层.
1.起始地址.
http://www.ah930.com.cn/movie/3311.html
从起始地址里面得到剧情介绍等内容.还要得到下面的调用地址.
2.调用地址
http://www.ah930.com.cn/index/playurl.php?id=3311&num=10
从调用地址里得到影片播放地址.
3.影片播放地址
http://www.ah930.com/index/play.php?urlid=27117&movid=3311&num=1&sip=0&pid=0&check=266c51394286a437ea67ad9b4042d06e
再从影片播放地址里得到视频实际地址.
4.视频实际地址
http://2.56zz.com:8032/210324977/D16A07FA97EA4AA05EA877B0F4BCFB0D21B7245D/保持缄默1.rmvb
还有一个难点.就是3.影片播放地址的数量是不固定的.
这样的站对刚接触采集的来说是难了点. 先谢谢fal的讲解了:ali12ls
我接触火车采集器大概有十来天的时间了,
采集一般的文章类型的网站太大的问题了,
但对一些软件下载或者电影网站的采集不是太明白,
要是管理员能出来一个采集类似多级连接的视频教程那就太好了
页:
[1]