火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
12
返回列表 发新帖
楼主: xxwl2008

终于遇到防采集的网站了,大网站不愧是大网站

[复制链接]
发表于 2007-11-13 01:05:10 | 显示全部楼层
抓包分析一下.
第二页 GET /browse/i_questionList.php?cid=10&start=20&status=R&num=20&t=1194886351890&_= HTTP/1.1
第三页 GET /browse/i_questionList.php?cid=10&start=40&status=R&num=20&t=1194886383265&_= HTTP/1.1
这是要采的列表页.区别只在start=这.最后也不一样,可以不用管.把20换成80看看.再打开第5页.OK能对的上.

打开 http://iask.sina.com.cn/browse/i_questionList.php?cid=10&start=20&status=R&num=20&t=1194886081812&_=

在里面找qid开头的  比如  qid":"10966008

再看地址 http://iask.sina.com.cn/b/10966008.html         

qid后面的数和网址文件名对应.
qid后的数抓出来设成参数,换进地址里.就OK了.
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-24 02:24

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表