火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4884|回复: 7

这样的拍拍页面采集他的粉丝的QQ号,URL没变,抓包没POST,该怎么办?

[复制链接]
发表于 2011-1-11 23:47:58 | 显示全部楼层 |阅读模式
http://ext.paipai.com/uinfo/Follows?userid=363855000&type=1&PTAG=20063.10.11#nolink


如题!!!帮下忙哦!!!
发表于 2011-1-12 11:38:59 | 显示全部楼层
Ajax和JS有没?
发表于 2011-1-12 13:02:39 | 显示全部楼层
用工具,可以采的。
发表于 2011-1-12 13:19:27 | 显示全部楼层


试试这个规则

分页用fiddle 可以抓取

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2011-1-12 14:05:55 | 显示全部楼层
对对。。。。老大厉害!就是用fiddle抓取的!!!
发表于 2011-1-12 14:10:54 | 显示全部楼层
本帖最后由 zhouchanglin 于 2011-1-12 14:16 编辑

粉丝分页网址:
  1. http://ext.paipai.com/concern/fanslist?userid=363855000&pageid=1&pagesize=14&callback=ManageFansListCallBack&t=
复制代码
关注分页网址;
  1. http://ext.paipai.com/concern/followlist?userid=363855000&pageid=1&pagesize=14&callback=ManageAttentionListCallBack&t=
复制代码
连接参数意思:
userid--------------用户QQ号

pageid--------------第几页

pagesize---------每页显示粉丝或关注人的个数,默认14

callback-------------数据处理函数



分页都是js控制的,所以没法采集分页,不过可以通过修改页面pagesize,用最大的数量,好像粉丝最多页只能是36页,数量最多500条,
改成
粉丝
  1. http://ext.paipai.com/concern/fanslist?userid=3638550008&pageid=1&pagesize=500&callback=ManageFansListCallBack&t=
复制代码
关注网址;
  1. http://ext.paipai.com/concern/followlist?userid=363855000&pageid=1&pagesize=500&callback=ManageAttentionListCallBack&t=
复制代码
就差不多都可以猜到

,好像顺序会和默认的不同,这样请求非常慢,但不需要插件处理得到分页




获得粉丝的函数:
  1. PP.miniIndex.getFansList=function
  2. (pageid){var userid=$getQuery('userid');
  3. $loadScript
  4. ("http://ext.paipai.com/concern/fanslist?
  5. userid="+userid+"&pageid="+pageid+"&pagesize=14&callback=ManageFansListCallBack&t="+Math.ran
  6. dom(),"getFansListScript",{charset:"gb2312"});};
复制代码
获得关注的
  1. PP.miniIndex.getFollowList=function(pageid){var userid=$getQuery('userid');$loadScript("http://ext.paipai.com/concern/followlist?userid="+userid+"&pageid="+pageid+"&pagesize=14&callback=ManageAttentionListCallBack&t="+Math.random(),"getAttentionListScript",{charset:"gb2312"});};PP.miniIndex.getFansList=function(pageid){var userid=$getQuery('userid');$loadScript("http://ext.paipai.com/concern/fanslist?userid="+userid+"&pageid="+pageid+"&pagesize=14&callback=ManageFansListCallBack&t="+Math.random(),"getFansListScript",{charset:"gb2312"});};
复制代码
需要在选项里,把采集请求超时放弃时间调长些,因为一下子请求数据几百条很慢,这主要取决于pagesize的大小,路过不需要太多,可以修改规则多页里的这个参数

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2011-1-12 14:14:50 | 显示全部楼层
太感谢了!!!好多好心的朋友。我也弄出来了!!!
发表于 2011-3-5 16:34:54 | 显示全部楼层
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-2 21:39

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表