漫画采集分页很是头痛
一直觉得火车做的很好,但很少有机会用,最近需要采集一些漫画,但是发现很多时候力不从心。虽然自我学习了好一会,不过还是没能开窍,遂半夜前来论坛请教。比如这个页面:http://dm.99770.com/comic/273/29039/3.htm?v=3*s=4
虽然规律非常好找,但是采集规则做起来有点困难,因为单采集这一卷漫画容易,但是要采集该作品下的所有卷内容就困难了。尽管所有卷的列表很容易获得。
我的思路是先访问作品,然后把所有列表收集起来,再深一层采集的时候把每卷漫画当作一个内容,每个作品有N个分页,可是分页老是分布出来,是能力问题呢,还是思路问题呢?
请指教~
关于分页,不知道是因为文章少还是我没找到,总觉得理解的太浅了,该如何提高这方面的能力呢.
P.S.漫画内容中,如果图片是调用JS文件来显示的,有好方法可以用火车来采集吗?
[ 本帖最后由 derstand 于 2008-4-13 00:09 编辑 ] 路过. 有专门的这个方面的采集教程
详见:使用js调用内容文件网站的采集方法教程 原帖由 火车头 于 2008-4-13 08:03 发表 http://bbs.locoy.com/images/common/back.gif
有专门的这个方面的采集教程
详见:使用js调用内容文件网站的采集方法教程
太感谢管理员了,思路上启发很大,我继续去研究一下
[ 本帖最后由 derstand 于 2008-4-13 11:35 编辑 ]
页:
[1]