火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1982|回复: 4

一些采集Qzone日志的思路

[复制链接]
发表于 2008-12-22 05:17:11 | 显示全部楼层 |阅读模式
QQ空间的日志标题和内容全被封装在blogmain.js里面
下载回来分析可以知道下面这段是来显示日志内容的:
  1. //使用blogid拉取一篇日志以及第一篇评论
  2. function getOneBlog(blogid,callback){
  3. if(!!parent.g_XDoc["blogRoot"].contentHSList[blogid]){
  4. callback({data:parent.g_XDoc["blogRoot"].contentHSList[blogid]});
  5. return;
  6. }

  7. parent.loadJsonData("blogContent","http://"+BLOG_DOMAIN+CGI_PATH+"blog_get_data?uin="+parent.g_iUin+"&numperpage="+PAGE_COMMENT_NUM+"&blogid="+blogid+"&arch=0&pos=0&direct=1&r="+Math.random(),callback,serrCallback,true,void(0),"_Callback");
  8. }

  9. //算出评论页数
  10. function getCommentPage(n){
  11. if(n!=-2)
  12. return n;
  13. else{
  14. with(contentProperty){
  15. return Math.ceil(totalCommentNumber/PAGE_COMMENT_NUM)+n+1;
  16. }
  17. }
  18. }
复制代码


再具体一些,内容的地址应该是:http://"+BLOG_DOMAIN+CGI_PATH+"blog_get_data?uin="+parent.g_iUin+"&numperpage="+PAGE_COMMENT_NUM+"&blogid="+blogid+"&arch=0&pos=0&direct=1&r="+Math.random(),callback,serrCallback,true,void(0),"_Callback

接下来,我们要做的工作便是用参数值来填空还原这个链接了.
我没还原出来,
楼下来搞吧
发表于 2008-12-22 09:16:11 | 显示全部楼层
没有那么麻烦,你抓包一下就知道了。看POST数据。用winsock expert方便
发表于 2008-12-22 09:25:04 | 显示全部楼层
透过现象看本质,答案会有的
发表于 2008-12-22 13:28:19 | 显示全部楼层
没有那么麻烦
 楼主| 发表于 2008-12-22 17:47:16 | 显示全部楼层

难道是我善于把简单问题复杂化?
楼上几位抓的包地址是多少,分享一下
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 01:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表