优酷超过100集电视剧或者动漫采集
优酷超过100集电视剧或者动漫在源代码中看不到分页地址。电视剧地址
http://www.youku.com/show_page/id_zcbff1994962411de83b1.html
可以通过替换show_page 为 show_episode获取前100集的地址,但是后面的无法获取
找了半天,发现原来分页格式是这样的。
www.youku.com/show_episode/id_zcc003400962411de83b1.html?dt=json&divid=reload_1&__rt=1&__ro=reload_1
reload_1 值的变化显示不同的集数 1 表示 1-20集 有的 表示1—40集
然后就是reload_21(或者41)依次显示不同集数
像这样该如何采集呢? 可以用插件实现采集 除了插件,就没有别的办法?貌似你回答很多问题都是这样。 我也研究了很久一直没搞定 :Q:Q chinachz 发表于 2014-11-19 09:39 static/image/common/back.gif
我也研究了很久一直没搞定
无限多页不就搞定了
页:
[1]