张晨曦 发表于 2008-12-18 20:31:27

高手帮忙看看这个页面分页数据怎么采cctv致富经

http://space.tv.cctv.com/act/platform/view/page/composePage.jsp?pageId=PAGE1196836162953107


这个页面。看看怎么获取分页。竟然地址栏不变 页面就分了,而且源代码里面也没有什么特别的

vippp 发表于 2009-5-16 00:16:06

如何解决,顶上去!

sushy 发表于 2009-5-16 12:53:40

这个我建议你不要分析了。

他使用了ajax 防刷新技术,所以你看不到页面源码变化。

另外,为了防采集,逃避采集软件的下载,他利用了双次提交的方式。

原理:
第一次提交,提交一个 http://space.tv.cctv.com/act/pla ... fresh=1242447101015 ,不返回值,1242447101015 为data()时间参数,具有唯一性,目的是在网站上存储一个唯一的标识符。然后再向 http://space.tv.cctv.com/act/pla ... fresh=1242447101015 post一个 currpage=5,这样,服务器返回数据,同时销毁前面建立的这个唯一的标识符。

由于浏览器可以对同一个页面进行二次提交,而火车目前还不能完全模拟浏览器运行,所以无法进行两次提交。这样,就无法采集到当前值。
页: [1]
查看完整版本: 高手帮忙看看这个页面分页数据怎么采cctv致富经