半分钟 发表于 2007-12-31 11:12:51

火车采集器是不是不能采集2级连接的网站?

像http://www.ah930.com.cn/这样的电影网站,

它的动作片列表第一页是http://www.ah930.com.cn/list/6_1.html,

像《保持缄默》这部电影
影片介绍页面是http://www.ah930.com.cn/movie/3311.html

而这部片子有上下二集,所以它有两个影片播放页面,
影片上集播放页面是http://www.ah930.com/index/play.php?urlid=27117&movid=3311&num=1&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124
影片下集播放页面是http://www.ah930.com/index/play.php?urlid=27118&movid=3311&num=2&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124

它的影片真实链接地址都是放在播放页面的,

像这种多页面多级链接的网站,火车采集器把它们的影片地址采集下来吗?

如果不可以,请管理员或版主告知一下,我弄了好几天了,一直都没有成功,如果不可以采集的话,也不想再烦了
如果可以采集的话,望告知一下应该怎样设置,


先谢谢了

rq204 发表于 2007-12-31 12:13:00

如果使用一级的方法是可以采到的,那么二级也是可以的

fal 发表于 2007-12-31 16:46:29

这个站已经不是两级.

影片上集播放页面是http://www.ah930.com/index/play.php?urlid=27117&movid=3311&num=1&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124
影片下集播放页面是http://www.ah930.com/index/play.php?urlid=27118&movid=3311&num=2&sip=0&pid=0&check=6f4cd11305ebdc426b2abe639bf2a124

这两个地址.在源码里看不到.用的是调用.
<div class="movienews3b">
                                          <script src="../index/playurl.php?id=3311&num=10"></script>

从起始地址到要采集的视频地址.一共有4层.
1.起始地址.
http://www.ah930.com.cn/movie/3311.html
从起始地址里面得到剧情介绍等内容.还要得到下面的调用地址.

2.调用地址
http://www.ah930.com.cn/index/playurl.php?id=3311&num=10
从调用地址里得到影片播放地址.

3.影片播放地址
http://www.ah930.com/index/play.php?urlid=27117&movid=3311&num=1&sip=0&pid=0&check=266c51394286a437ea67ad9b4042d06e
再从影片播放地址里得到视频实际地址.

4.视频实际地址
http://2.56zz.com:8032/210324977/D16A07FA97EA4AA05EA877B0F4BCFB0D21B7245D/保持缄默1.rmvb

还有一个难点.就是3.影片播放地址的数量是不固定的.

这样的站对刚接触采集的来说是难了点.

半分钟 发表于 2008-1-1 09:25:10

先谢谢fal的讲解了:ali12ls

我接触火车采集器大概有十来天的时间了,
采集一般的文章类型的网站太大的问题了,
但对一些软件下载或者电影网站的采集不是太明白,
要是管理员能出来一个采集类似多级连接的视频教程那就太好了
页: [1]
查看完整版本: 火车采集器是不是不能采集2级连接的网站?