qzstock 发表于 2007-4-8 12:07:19

卓越网里面含有<a href=" 这样的页面怎么采集链接不要随机参数

你好,我能不能问下
卓越网的这样的页面里面
http://www.joyo.com/rank/store_rank.asp?storeID=60&paihangID=1
链接的形式是这样的:
<div class="Name"><a href="/detail/product.asp?prodid=bkbk718819&ref=TS&uid=aas5ewv12a9um7sg99gg5sg77" class="medium">那些男孩教我的事(蔡康永代表作,附赠北大演讲DVD!)</a></div>
其实实际的地址就是/detail/product.asp?prodid=bkbk718819
但是我好像用什么办法(包括自定义链接)都没有把后面那些去掉,因为如果不去掉,有些如 &uid=aas5ewv12a9um7sg99gg5sg77是随机的,会造成重复采集,
能帮忙看下有没有办法解决吗

rq204 发表于 2007-4-9 16:16:36

自定义链接是可以用的。。。

rq204 发表于 2007-4-9 16:17:54

网址:
页: [1]
查看完整版本: 卓越网里面含有<a href=" 这样的页面怎么采集链接不要随机参数