|
|
本帖最后由 ghosttzs 于 2010-2-7 18:11 编辑
地址是:http://www.mingsuo.com/index.jsp
第一关:
post 抓包分析出 北京javascript:citySubmit('110000','','');
北京的实际地址是 http://www.mingsuo.com/serch?_actionType=serchData&areacode=110000&citycode=&citycodename=
如果是天津 javascript:citySubmit('120000','',''); 只需要替换响应的数值即可。
第二关:
每页只显示 3页 其总共有 找到 2836589 结果 ,每页10条记录,共283659页
不过经过发现 分页按钮上的 javascript:goto(3); 代表了分页 比如要访问第100页 只需要在 javascript:goto(100);即可
第三关:
也就采集列表页,这关正在研究,有点难度。post抓包抓出来好多。。。- callCount=1
- page=/serch
- httpSessionId=914A4A90F77BBD39BA9026695CCF0169
- scriptSessionId=6B127750090DF5718268D16772F5D3CF497
- c0-scriptName=sousuo
- c0-methodName=getQYdata
- c0-id=0
- c0-param0=string:
- c0-param1=string:qymc
- c0-param2=string:120000
- c0-param3=string:
- c0-param4=string:
- c0-param5=string:
- c0-param6=number:2
- c0-param7=number:10
- batchId=4
复制代码 继续研究中。。。大家一起研究研究怎么攻破它吧 |
|