分享采集思路:
jquery加载的网站采集办法。用火狐找到传递jquery参数的url
将该url复制到ie上打开。查看源码。这时候你会发现有一大堆乱七八糟的东西。
不要慌。仔细分析下源码。 一般获取的内容页地址都有规律的。比如地址上都有一个
achieve。这时你可以利用火车头里面的正则匹配的方法匹配到相应的所需的参数。组
成真正需要采集的地址。
flash站信息采集的办法。
首先将信息列表页的flash用工具下载下来。下载下来的一般是swf后缀的文件。
接下来用硕思转为fla格式的flash编辑文件。
最后你需要做的就是分析flash内部的action源码找出列表页调用的真正页面的url和相关参数获取到真正需要采集的列表页。然后你就可以配置采集了。 {:4_180:}{:4_180:}{:4_180:}收获了 第二个方法不错~~~~~~~~~~ 支持火车。。。。历史帖子回顾中。
页:
[1]