lghyt 发表于 2013-11-5 10:27:49

这种带#的网站采集起来很恐怖

本帖最后由 lghyt 于 2013-11-5 10:35 编辑

入口是http://roll.sports.qq.com/# ,点击每一页全一样,也不知这是用啥做的,火车头的套路用在它身上没用了。火车头看来又要升级了。

这站做的另人发指!

303718 发表于 2013-11-5 11:21:39

这种要抓包分析真实地址再采集就行

lghyt 发表于 2013-11-5 11:26:22

本帖最后由 lghyt 于 2013-11-5 11:38 编辑

303718 发表于 2013-11-5 11:21 static/image/common/back.gif
这种要抓包分析真实地址再采集就行

能给一些资料吗,谢谢,现在连去哪找参考都没有。
http://bbs.locoy.com/spider-135248-1-4.html感觉这个帖子类似,但也没有说出方法
页: [1]
查看完整版本: 这种带#的网站采集起来很恐怖