淘宝 天猫多页获取宝贝详细 教程
以淘宝和天猫多页采集为例淘宝,例如
http://item.taobao.com/item.htm?id=16598015559
需要采集此页的宝贝详细
经过抓包等一系列分析 得到 详细页真实地址 是
http://dsc.taobaocdn.com/i5/160/980/16598015559/T1lbf5Xl8jXXcWeqbX.desc%7Cvar%5Edesc%3Bsign%5Ee8ff6f95e879bdaeddd4a169cac0c808%3Blang%5Egbk%3Bt%5E1352562053
查看网页源代码 可以发现 在这里
此时我们需要用到 多页匹配到 这个详细页真实地址,然后根据这个真实地址 采集就可以了
1、 点击
2、 命名为宝贝详情,用第二种方式,正则参数匹配 得到这个真实网址。
3、 你也可以在这里测试下 得到的网址对不对。
4、 正确的话 就保存
5、 然后标签里 调用多页
(1) 这里选择刚才保存的那个多页
(2) 根据多页地址,也就是宝贝详情的真实地址,设置前台截取
(3) 保存即可。
6、 测试结果如下
++++++++++++++++++++++++++++++++++++++++++++++
天猫,例如
http://detail.tmall.com/item.htm?id=19828008229
多页地址
http://dsc.taobaocdn.com/i2/191/280/19828008229/T1UbY0Xe4kXXcWeqbX.desc%7Cvar%5Edesc%3Bsign%5E68b554151074252e586aa7fbc13fe96a%3Blang%5Egbk%3Bt%5E1352697004
源代码里
剩下的步骤 可以尝试 自己写。。。
一样的道理。。。
淘宝的不用什么分析,记住一个特点就可以了.就是找下面这个值
http://dsc.
淘宝并不是所有的都一样,,但我发现,这个http://dsc.是共同特点 请教下这些采集下来之后如何弄到自己的淘宝宝贝里去? 不错 学习了{:soso_e179:} O(∩_∩)O谢谢 学习了 要好好学习,呵呵!
"经过抓包等一系列分析 得到 详细页真实地址 是"
很想知道这个过程,抓包一般都会出很多地址,怎么知道这个是真实的呢 学习下,淘宝的总是搞不好,郁闷中 :hug::hug::hug:学习下 good very www.chinagirl.cn