覃生 发表于 2007-10-20 17:13:15

不管你多牛,你就是采集不了腾讯的内容!

我已整整搞了一天了,
从天亮搞到天黑,都搞不到,
我想采集QQ群的信息,
http://group.qq.com/category_search.html?catalogid=98
就是这页面,想采集QQ群号码和群相关的信息,
可是腾讯把页面做了超级变态的代码,怎么也搞不到规则!

你觉得你很牛的话,你试一下,
假如你可以的话,我拜你为师!!!

ftmouse 发表于 2007-10-20 17:35:59

看你说话的态度,我就心烦
很简单的页面了
http://group.qq.com/data/rank_98.xml
你自己抓包看看它返回的xml。采集这个就可以了
这是其中一个页面。自己抓包分析。

rq204 发表于 2007-10-20 17:39:00

采这做什么?群发QQ垃圾.

覃生 发表于 2007-10-20 17:43:46

原帖由 ftmouse 于 2007-10-20 17:35 发表 http://bbs.locoy.com/images/common/back.gif
看你说话的态度,我就心烦
很简单的页面了
http://group.qq.com/data/rank_98.xml
你自己抓包看看它返回的xml。采集这个就可以了
这是其中一个页面。自己抓包分析。
:Q
为什么,你会,我不会!!!

但是这样采,采不到QQ群的创建者的信息,要采QQ群完整的信息,应该怎么搞啊?

shinra 发表于 2007-10-20 20:10:14

我也在试,目前只能采到单页的群聊记录,不知道怎么搞分页

ccqwq 发表于 2007-10-21 17:04:33

楼上的各位大师,你们好!能给解释一下“data/rank_98.xml”吗?
我感觉采集最难的就是如何得到正确的原码!

cctalk 发表于 2007-10-21 17:28:21

:lol :lol :lol :lol

shinra 发表于 2007-10-23 20:26:07

关于这个"data/rank_98.xml",这是一个相对路径,前面再加上当前访问路径就是真实的绝对路径了
比如,以上源码是从xx.com/locoy/index.htm中出现,则,"data/rank_98.xml"的真实路径就是xx.com/locoy/data/rank_98.xml

cike8588 发表于 2007-10-24 12:19:28

呵呵..搞定没的 !!!!
页: [1]
查看完整版本: 不管你多牛,你就是采集不了腾讯的内容!