JinGui 发表于 2011-2-27 19:09:27

【方法】如何采集淘宝宝贝的浏览数和收藏数?附规则

最近遇到一部分客户在论坛及QQ上咨询淘宝宝贝的浏览数和收藏数,现将方法整理如下:

ok,简单的说下方法吧,现在我们以我们
官方的淘宝店   http://hefeilocoy.taobao.com
的旗舰加密狗版为例 网址:http://item.taobao.com/item.htm?id=9142584627
经过分析或者抓包不难发现源代码里 "apiItemViews":   后面跟的网址里面就是有我们所需要的浏览次数"http://count.taobao.com/counter2?keys=ICVT_7_9142584627&inc=ICVT_7_9142584627&callback=page_viewcount&sign=29594737fce6b46335390990c60be8fd2dd5c"
然后我们使用多页采集这个网页,然后源代码将浏览数采集到。

收藏数次的话,经过点击我们也不难发现(你找个有收藏次数的宝贝点击下就知道了) 在 http://favorite.taobao.com/collect_item_relation---9142584627-1-.htm这个页面内有收藏次数, 9142584627这个为宝贝的id 于是我们也多页获取这个宝贝id并拼凑成以上网址的样式,然后多页采集即可。

具体的见附件 淘宝浏览数和收藏数的采集规则:

专业收费采集 发表于 2011-2-27 22:57:58

好东西 一定要收藏

蔡森斌 发表于 2011-3-1 14:07:03

经过分析或者抓包不难发现源代码里 "apiItemViews":

这句话不知道怎么理解    {:3_148:}

hawks1 发表于 2011-3-1 20:55:40

我也不是很理解啊~ 晕

JinGui 发表于 2011-3-2 09:20:06

回复 4# hawks1


{:2_130:}
    下下来看看规则就明白了,可能表达的不是很好……

seozy 发表于 2011-3-5 14:06:10

绝对要顶。。。万分感谢了。

蔡森斌 发表于 2011-3-5 14:25:12

通过抓包工具fiddler找到浏览数和收藏数的真实地址后,在源码中找不到相关的参数,无法通过默认页原代码采集得到地址,只能通过规则对默认页地址替换生成地址,使用正则测试,就能得到想要的浏览数和收藏数了。
这需要你理解一些正则字符的使用,如.,*,?等……{:3_166:}
页: [1]
查看完整版本: 【方法】如何采集淘宝宝贝的浏览数和收藏数?附规则