天大地大 发表于 2009-5-25 17:40:12

【求助】如何采集?这个链接跳转了两次……

本帖最后由 天大地大 于 2009-5-25 19:45 编辑

为什么阿里妈妈淘客链接跳转了两次火车头就采集不到实际内容页了,如采集这个地址:
http://s.click.alimama.com/a/qvQrX+XJYcg=-12816987

最后才跳转到这个实际地址:http://item.taobao.com/auction/item_detail--.jhtml?taomi=8aR2LQR6GJA3c9siMH%2B%2FGnAQhIynEdNRT8UoKDmQZimu4vmxBlr94UxhI1X4kNQvV6Q7VqVX3ci%2BzR48tg%2FACai1tdmPFaSlUqvtENcY7YXH5nPJ%2F2BWRzTTf8rw3LKKuw%2FVLtGSNs1AhLkv34xHffZb3lcY99L0qkjHmI7wDH8TeEiPg7M%2B7gCpE%2BQqeBusXK3pZKM8TpHytQtRDo7QK91ke0KHIheirD%2BYQbHLJ%2F6QkGuOqfM4NdAAH5LavjggJ20t&ref=

如何采集到最后那个实际地址或者内容,请大侠指教,谢谢~~~

天大地大 发表于 2009-5-25 21:39:12

是不是火车无法采集这种呢?……

afanfan2007 发表于 2009-5-25 22:04:02

来个多页采集 应该就行了

天大地大 发表于 2009-5-26 13:59:03

来个多页采集 应该就行了
afanfan2007 发表于 2009-5-25 22:04 http://bbs.locoy.com/images/common/back.gif

谢谢版主啊,可惜这个貌似js调用的,而且跳转前后的网址找不到一丝联系……

天大地大 发表于 2009-5-27 11:27:30

继续期待ali95ls

zhouchanglin 发表于 2009-5-27 16:20:36

"apiItemDesc":"http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427",

http://dsc04.taobao.com/i4/5a1/d ... BiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427
才是地址,来个多页采集 就行了,

天大地大 发表于 2009-5-27 17:34:36

本帖最后由 天大地大 于 2009-5-27 17:41 编辑

"apiItemDesc":"http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427",

http://dsc04.taobao ...
zhouchanglin 发表于 2009-5-27 16:20 http://bbs.locoy.com/images/common/back.gif

谢谢关注。但是,从“http://s.click.alimama.com/a/qvQrX+XJYcg=-12816987”这个地址及其源码,没法采集到“http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427”吧?

(ps:当然,从“http://item.taobao.com/auction/item_detail--.jhtml?taomi=8aR2LQR6GJA3c9siMH%2B%2FGnAQhIynEdNRT8UoKDmQZimu4vmxBlr94UxhI1X4kNQvV6Q7VqVX3ci%2BzR48tg%2FACai1tdmPFaSlUqvtENcY7YXH5nPJ%2F2BWRzTTf8rw3LKKuw%2FVLtGSNs1AhLkv34xHffZb3lcY99L0qkjHmI7wDH8TeEiPg7M%2B7gCpE%2BQqeBusXK3pZKM8TpHytQtRDo7QK91ke0KHIheirD%2BYQbHLJ%2F6QkGuOqfM4NdAAH5LavjggJ20t&ref=
”,采集到“http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427”,这个的确是容易用多页采集实现的。您的回复,只是解决的这个问题。)

天大地大 发表于 2009-5-27 17:45:30

本帖最后由 天大地大 于 2009-5-27 17:48 编辑

3# afanfan2007

“应该”——版主措辞很严谨哦;)~~~

但是,貌似还真不行…………

zhouchanglin 发表于 2009-5-28 11:07:05

本帖最后由 zhouchanglin 于 2009-5-28 11:09 编辑

能否把列表网址贴上,向高难度挑战,哈哈

天大地大 发表于 2009-5-29 14:02:33

本帖最后由 天大地大 于 2009-5-29 14:44 编辑

能否把列表网址贴上,向高难度挑战,哈哈
zhouchanglin 发表于 2009-5-28 11:07 http://bbs.locoy.com/images/common/back.gif

前辈风范!钦佩!!
列表网址:http://www.bangnitao.net/

这个列表网址及内容的采集,难度已远远超过了小菜我本帖的发问。也欢迎来我就您此回复而发布的新帖指教:http://bbs.locoy.com/spider-39771-1-1.html
页: [1]
查看完整版本: 【求助】如何采集?这个链接跳转了两次……