【求助】如何采集?这个链接跳转了两次……
本帖最后由 天大地大 于 2009-5-25 19:45 编辑为什么阿里妈妈淘客链接跳转了两次火车头就采集不到实际内容页了,如采集这个地址:
http://s.click.alimama.com/a/qvQrX+XJYcg=-12816987
最后才跳转到这个实际地址:http://item.taobao.com/auction/item_detail--.jhtml?taomi=8aR2LQR6GJA3c9siMH%2B%2FGnAQhIynEdNRT8UoKDmQZimu4vmxBlr94UxhI1X4kNQvV6Q7VqVX3ci%2BzR48tg%2FACai1tdmPFaSlUqvtENcY7YXH5nPJ%2F2BWRzTTf8rw3LKKuw%2FVLtGSNs1AhLkv34xHffZb3lcY99L0qkjHmI7wDH8TeEiPg7M%2B7gCpE%2BQqeBusXK3pZKM8TpHytQtRDo7QK91ke0KHIheirD%2BYQbHLJ%2F6QkGuOqfM4NdAAH5LavjggJ20t&ref=
如何采集到最后那个实际地址或者内容,请大侠指教,谢谢~~~ 是不是火车无法采集这种呢?…… 来个多页采集 应该就行了 来个多页采集 应该就行了
afanfan2007 发表于 2009-5-25 22:04 http://bbs.locoy.com/images/common/back.gif
谢谢版主啊,可惜这个貌似js调用的,而且跳转前后的网址找不到一丝联系…… 继续期待ali95ls "apiItemDesc":"http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427",
http://dsc04.taobao.com/i4/5a1/d ... BiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427
才是地址,来个多页采集 就行了, 本帖最后由 天大地大 于 2009-5-27 17:41 编辑
"apiItemDesc":"http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427",
http://dsc04.taobao ...
zhouchanglin 发表于 2009-5-27 16:20 http://bbs.locoy.com/images/common/back.gif
谢谢关注。但是,从“http://s.click.alimama.com/a/qvQrX+XJYcg=-12816987”这个地址及其源码,没法采集到“http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427”吧?
(ps:当然,从“http://item.taobao.com/auction/item_detail--.jhtml?taomi=8aR2LQR6GJA3c9siMH%2B%2FGnAQhIynEdNRT8UoKDmQZimu4vmxBlr94UxhI1X4kNQvV6Q7VqVX3ci%2BzR48tg%2FACai1tdmPFaSlUqvtENcY7YXH5nPJ%2F2BWRzTTf8rw3LKKuw%2FVLtGSNs1AhLkv34xHffZb3lcY99L0qkjHmI7wDH8TeEiPg7M%2B7gCpE%2BQqeBusXK3pZKM8TpHytQtRDo7QK91ke0KHIheirD%2BYQbHLJ%2F6QkGuOqfM4NdAAH5LavjggJ20t&ref=
”,采集到“http://dsc04.taobao.com/i4/5a1/d80/5aad8138da88e7c05cc1f8788f76ff4b/T1eHBiXXfVf0NXXXXX.desc|var^desc;sign^561a19d7f150ef3971ee462d73f36816;lang^gbk;t^1243328427”,这个的确是容易用多页采集实现的。您的回复,只是解决的这个问题。) 本帖最后由 天大地大 于 2009-5-27 17:48 编辑
3# afanfan2007
“应该”——版主措辞很严谨哦;)~~~
但是,貌似还真不行………… 本帖最后由 zhouchanglin 于 2009-5-28 11:09 编辑
能否把列表网址贴上,向高难度挑战,哈哈 本帖最后由 天大地大 于 2009-5-29 14:44 编辑
能否把列表网址贴上,向高难度挑战,哈哈
zhouchanglin 发表于 2009-5-28 11:07 http://bbs.locoy.com/images/common/back.gif
前辈风范!钦佩!!
列表网址:http://www.bangnitao.net/
这个列表网址及内容的采集,难度已远远超过了小菜我本帖的发问。也欢迎来我就您此回复而发布的新帖指教:http://bbs.locoy.com/spider-39771-1-1.html
页:
[1]