琉璃月 发表于 2013-4-27 22:23:51

怎么把一个淘宝页面下的所有商品网址都采集到啊

如果采集一个淘宝页面下的所有商品的网址呢?例如采集这个淘宝页面
http://s8.taobao.com/search?spm=a230z.1.5634029.377.XNjNkh&q=%B7%AB%B2%BC%D0%AC&commend=all&ssid=s5-e&pid=mm_11916137_3364353_10870918&tab=coefp&s=0#J_FilterTabBar
我想把这个网页上的40个商品的网址采集到,怎么做呢,我自己试了一下,但是有错误啊。我说说我的做法啊,大家教我怎么改啊。谢谢了。

起始网址中放入的网址就是上面提到的王子。
下面是多级网址采集规则手动填写的链接地址规则。
<h3 class="summary"><a stat="(*)" href="[参数]" target="_blank" class="EventCanSelect" title="[标签:标题]">(*)</a></h3>

可是测试结果里只出现20条,而且网址都是这样的格式:http://support.taobao.com/myservice/suit/accuse_punish.jhtml?Query=%B7%AB%B2%BC%D0%AC&BucketID=0&auction_num_id=14879102645


这跟实际的宝贝的链接地址:http://detail.tmall.com/item.htm?id=23495904550&ali_trackid=2:mm_11916137_3364353_10870918:1367072699_3k2_1400106116&clk1=907846ab858d9969d43b213e3ea829f5&spm=a230z.1.5634029.2.Fwyd9S不一样啊。请各位大牛帮帮忙啊。

303718 发表于 2013-5-1 09:05:59

这样

琉璃月 发表于 2013-5-1 21:23:03

303718 发表于 2013-5-1 09:05 static/image/common/back.gif
这样

谢谢谢谢非常感谢啊{:4_180:}
页: [1]
查看完整版本: 怎么把一个淘宝页面下的所有商品网址都采集到啊