不管你多牛，你就是采集不了腾讯的内容！

覃生发表于 2007-10-20 17:13:15

我已整整搞了一天了，
从天亮搞到天黑，都搞不到，
我想采集QQ群的信息，
http://group.qq.com/category_search.html?catalogid=98
就是这页面，想采集QQ群号码和群相关的信息，
可是腾讯把页面做了超级变态的代码，怎么也搞不到规则！

你觉得你很牛的话，你试一下，
假如你可以的话，我拜你为师！！！

ftmouse 发表于 2007-10-20 17:35:59

看你说话的态度，我就心烦
很简单的页面了
http://group.qq.com/data/rank_98.xml
你自己抓包看看它返回的xml。采集这个就可以了
这是其中一个页面。自己抓包分析。

rq204 发表于 2007-10-20 17:39:00

采这做什么？群发QQ垃圾.

覃生发表于 2007-10-20 17:43:46

原帖由 ftmouse 于 2007-10-20 17:35 发表 http://bbs.locoy.com/images/common/back.gif
看你说话的态度，我就心烦
很简单的页面了
http://group.qq.com/data/rank_98.xml
你自己抓包看看它返回的xml。采集这个就可以了
这是其中一个页面。自己抓包分析。
:Q
为什么，你会，我不会！！！

但是这样采，采不到QQ群的创建者的信息，要采QQ群完整的信息，应该怎么搞啊？

shinra 发表于 2007-10-20 20:10:14

我也在试，目前只能采到单页的群聊记录，不知道怎么搞分页

ccqwq 发表于 2007-10-21 17:04:33

楼上的各位大师，你们好！能给解释一下“data/rank_98.xml”吗？
我感觉采集最难的就是如何得到正确的原码！

cctalk 发表于 2007-10-21 17:28:21

:lol :lol :lol :lol

shinra 发表于 2007-10-23 20:26:07

关于这个"data/rank_98.xml",这是一个相对路径,前面再加上当前访问路径就是真实的绝对路径了
比如,以上源码是从xx.com/locoy/index.htm中出现,则,"data/rank_98.xml"的真实路径就是xx.com/locoy/data/rank_98.xml

cike8588 发表于 2007-10-24 12:19:28

呵呵..搞定没的 !!!!

页: [1]

火车采集器软件交流官方论坛's Archiver

不管你多牛，你就是采集不了腾讯的内容！