电影站采集...希望高手指点一下!!!
今天刚用的火车头,很多地方不是太明白这个网页:http://www.29245.com/Movie/276/
我要采集的是它的标题,缩略图,演员,剧情,内容(即播放地址)等.
其中标题,缩略图,演员和剧情都在主采集页内,没有问题,
但是内容(也就是播放地址)是在主采集页的下级页(播放页内),
现在我要做的就是把这20个播放页的各条播放地址采出来合并在一起做成内容. 设置多页面,但一次只能到采一条播放地址.
希望高手指点一下 一个多页面一般就对应一个的啊
除非标签循环 但是标签循环貌似还是有bug
所以…………
我暂时没有什么好的办法 我也是这个问题主页面里面的下级页面有2个以上 就不能多页面了 只能一个
不过好像有人做出来了 不知道这么弄 是能做出来 但是不会比较麻烦吗
要做的话 至少要定义二十个标签和相应的二十个多页面(按照我的思路)
如果集数多的话 还会更多 能做出来,马克斯采集加入马克斯库,不过那是有人付费找我写的..
顺便说一下,这个问题已经跟火车头反应了..
火车头采不了马克斯这样的程序.因为在多页采集那里还不能循环.
其实不一定要多页循环,把电影路径改标签改成内容,用下一页的方式也行.
然后把内设置内容页循环采集. 是分页问题吗?
页:
[1]