windmage 发表于 2011-1-17 17:54:50

[已解决]求助,如何采集这个加密了的页面的列表地址

本帖最后由 windmage 于 2011-1-22 11:30 编辑

地址是:
http://www.debenhams.com/men/tops-polos#catalogId=10001&lid=//productsuniverse/en_GB/product_online%3DY/categories%3C{productsuniverse_18664}/categories%3C{productsuniverse_18664_18519}/categories%3C{productsuniverse_18664_18519_64947_ms}&ps=default&storeId=10001
如下图,我想采集各个产品的地址,但经过加密了,直接采集不了,在些虚心请教,如果前辈有时间希望能详细说一说。如果忙,给个方法出来也万分感激。


这段是第一个产品的源代码:
<td class="product_detail highlight">                              
<a href="/webapp/wcs/stores/servlet/prod_10001_10001_070010433343_-1?breadcrumb=Home%7EMen%7ETops+%26amp%3B+polos" onclick="sc_trackLink('&lid=070010433343-Discount');" name="&lid=prod_070010433343-Discount"><img src="http://debenhams.scene7.com/is/image/Debenhams/070010433343?$PSPMedium$" alt="">
<div class="product_summary">

<div class="brand_name">St George by Duffer</div>
<div class="product_name">Navy pique polo shirt</div>   
<div class="product_price">Was &pound;25.00</div>
<div class="product_price latest">Now &pound;20.00</div>
</div></a>
</td>   


sc_trackLink()这个函数是系统自带的还是这里页面里另外编写的?我在这页面里找不到定义sc_trackLink()的地方。我不太会找。





再次弄了四个产品的源代码出来,果如果如二楼说的,地址都直接看到了。之前这些代码放在记事本里,弄出很多行来看得不清。现在放在word里,一行过。一下就看出来了。

303718 发表于 2011-1-17 18:08:08

查看源代码不是有地址吗。哪里加密了

windmage 发表于 2011-1-20 11:37:09

看到加密了,不过那一串太长了,理解不了。希望指点一下。
页: [1]
查看完整版本: [已解决]求助,如何采集这个加密了的页面的列表地址