kuhabe 发表于 2012-11-12 15:18:56

淘宝 天猫多页获取宝贝详细 教程

以淘宝和天猫多页采集为例

淘宝,例如
http://item.taobao.com/item.htm?id=16598015559
需要采集此页的宝贝详细


经过抓包等一系列分析 得到 详细页真实地址 是
http://dsc.taobaocdn.com/i5/160/980/16598015559/T1lbf5Xl8jXXcWeqbX.desc%7Cvar%5Edesc%3Bsign%5Ee8ff6f95e879bdaeddd4a169cac0c808%3Blang%5Egbk%3Bt%5E1352562053

查看网页源代码 可以发现 在这里



此时我们需要用到 多页匹配到 这个详细页真实地址,然后根据这个真实地址 采集就可以了

1、        点击


2、        命名为宝贝详情,用第二种方式,正则参数匹配 得到这个真实网址。



3、        你也可以在这里测试下 得到的网址对不对。
4、        正确的话 就保存
5、        然后标签里 调用多页



    (1)        这里选择刚才保存的那个多页
    (2)        根据多页地址,也就是宝贝详情的真实地址,设置前台截取
    (3)        保存即可。
6、        测试结果如下





++++++++++++++++++++++++++++++++++++++++++++++


天猫,例如
http://detail.tmall.com/item.htm?id=19828008229

多页地址
http://dsc.taobaocdn.com/i2/191/280/19828008229/T1UbY0Xe4kXXcWeqbX.desc%7Cvar%5Edesc%3Bsign%5E68b554151074252e586aa7fbc13fe96a%3Blang%5Egbk%3Bt%5E1352697004

源代码里




剩下的步骤 可以尝试 自己写。。。

一样的道理。。。


dougeng 发表于 2012-11-16 20:24:05

淘宝的不用什么分析,记住一个特点就可以了.就是找下面这个值
http://dsc.
淘宝并不是所有的都一样,,但我发现,这个http://dsc.是共同特点

xiaoyongwudi 发表于 2012-11-16 12:09:14

请教下这些采集下来之后如何弄到自己的淘宝宝贝里去?

zbn 发表于 2012-11-16 21:11:05

不错 学习了{:soso_e179:}

hctok 发表于 2012-11-25 22:29:07

O(∩_∩)O谢谢 学习了

eday 发表于 2012-11-29 15:28:25

要好好学习,呵呵!

jy129056 发表于 2012-12-14 14:47:46

"经过抓包等一系列分析 得到 详细页真实地址 是"

   很想知道这个过程,抓包一般都会出很多地址,怎么知道这个是真实的呢

shuimu0001 发表于 2013-1-5 16:28:44

学习下,淘宝的总是搞不好,郁闷中

pon826 发表于 2013-1-17 00:06:30

:hug::hug::hug:学习下

dalianvv 发表于 2013-1-20 03:53:13

good very www.chinagirl.cn
页: [1] 2 3 4
查看完整版本: 淘宝 天猫多页获取宝贝详细 教程