火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2670|回复: 2

高手帮忙看看这个页面分页数据怎么采cctv致富经

[复制链接]
发表于 2008-12-18 20:31:27 | 显示全部楼层 |阅读模式
http://space.tv.cctv.com/act/platform/view/page/composePage.jsp?pageId=PAGE1196836162953107


这个页面。看看怎么获取分页。竟然地址栏不变 页面就分了,而且源代码里面也没有什么特别的
发表于 2009-5-16 00:16:06 | 显示全部楼层
如何解决,顶上去!
发表于 2009-5-16 12:53:40 | 显示全部楼层
这个我建议你不要分析了。

他使用了ajax 防刷新技术,所以你看不到页面源码变化。

另外,为了防采集,逃避采集软件的下载,他利用了双次提交的方式。

原理:
第一次提交,提交一个 http://space.tv.cctv.com/act/pla ... fresh=1242447101015 ,不返回值,1242447101015 为data()时间参数,具有唯一性,目的是在网站上存储一个唯一的标识符。然后再向 http://space.tv.cctv.com/act/pla ... fresh=1242447101015 post一个 currpage=5,这样,服务器返回数据,同时销毁前面建立的这个唯一的标识符。

由于浏览器可以对同一个页面进行二次提交,而火车目前还不能完全模拟浏览器运行,所以无法进行两次提交。这样,就无法采集到当前值。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-20 04:52

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表