卓越网里面含有<a href=" 这样的页面怎么采集链接不要随机参数
你好,我能不能问下卓越网的这样的页面里面
http://www.joyo.com/rank/store_rank.asp?storeID=60&paihangID=1
链接的形式是这样的:
<div class="Name"><a href="/detail/product.asp?prodid=bkbk718819&ref=TS&uid=aas5ewv12a9um7sg99gg5sg77" class="medium">那些男孩教我的事(蔡康永代表作,附赠北大演讲DVD!)</a></div>
其实实际的地址就是/detail/product.asp?prodid=bkbk718819
但是我好像用什么办法(包括自定义链接)都没有把后面那些去掉,因为如果不去掉,有些如 &uid=aas5ewv12a9um7sg99gg5sg77是随机的,会造成重复采集,
能帮忙看下有没有办法解决吗 自定义链接是可以用的。。。 网址:
页:
[1]