本帖最后由 小东 于 2009-6-6 01:55 编辑
刚接触火车头,学习遇到疑惑
求解惑
站点和任务结构图
采集的电影分类
要采集的电影页面
制作采集网址规则
采集到所有电影页面的连接
测试采集电影页面的内容
获取播放连接真实下在地址的配置
论坛上图片大小编辑挺麻烦的,想调成原始大小的还挺困难的 为难大伙眼睛了 我遇到的问题主要在 图6、测试采集电影页面的内容.GIF
采集出来的内容有点问题 1、采集出来的内容没有根据我[页面内容自定义]标签名的排序去排列
2、采集出来的[电影介绍]标签所对应的内容,存在很多回车,想去掉
3、也是我最头疼的问题
我想采集
【播放连接对应真实播放地址】: http://video.sina.com.cn/deco/2008/1118/flvPlayer1218.swf?vid=17137705
但是不知道如何让他循环采集下去
可能我用的方法不是很好,我只是想采集页面中所有真实的视频地址。
希望论坛上的心肠热、技术好的朋友可以为我解答。谢谢。
备注:【播放连接对应真实播放地址】这个标签里采集到的视频播放地址是想和[电影播放连接]中的连接指想的视频页面一一对应的。 |