[已解决]求助,如何采集这个加密了的页面的列表地址
本帖最后由 windmage 于 2011-1-22 11:30 编辑地址是:
http://www.debenhams.com/men/tops-polos#catalogId=10001&lid=//productsuniverse/en_GB/product_online%3DY/categories%3C{productsuniverse_18664}/categories%3C{productsuniverse_18664_18519}/categories%3C{productsuniverse_18664_18519_64947_ms}&ps=default&storeId=10001
如下图,我想采集各个产品的地址,但经过加密了,直接采集不了,在些虚心请教,如果前辈有时间希望能详细说一说。如果忙,给个方法出来也万分感激。
这段是第一个产品的源代码:
<td class="product_detail highlight">
<a href="/webapp/wcs/stores/servlet/prod_10001_10001_070010433343_-1?breadcrumb=Home%7EMen%7ETops+%26amp%3B+polos" onclick="sc_trackLink('&lid=070010433343-Discount');" name="&lid=prod_070010433343-Discount"><img src="http://debenhams.scene7.com/is/image/Debenhams/070010433343?$PSPMedium$" alt="">
<div class="product_summary">
<div class="brand_name">St George by Duffer</div>
<div class="product_name">Navy pique polo shirt</div>
<div class="product_price">Was £25.00</div>
<div class="product_price latest">Now £20.00</div>
</div></a>
</td>
sc_trackLink()这个函数是系统自带的还是这里页面里另外编写的?我在这页面里找不到定义sc_trackLink()的地方。我不太会找。
再次弄了四个产品的源代码出来,果如果如二楼说的,地址都直接看到了。之前这些代码放在记事本里,弄出很多行来看得不清。现在放在word里,一行过。一下就看出来了。 查看源代码不是有地址吗。哪里加密了 看到加密了,不过那一串太长了,理解不了。希望指点一下。
页:
[1]