各位大侠们,请你们帮帮忙啊,我描述下我的问题
要采集的有两种情况,一:<div id="sitemap-link" style="width: 380px;; overflow: hidden;"><ul><li> <a href="http://www.boutiqueairmaxfr.com/">Accueil</a> ::
<a href="http://www.boutiqueairmaxfr.com/nike-air-griffey-max-c-98.html">Nike Air Griffey Max</a> ::
Homme Nike Air Griffey Max 1
</li></ul></div>
二:<div id="sitemap-link" style="width: 380px;; overflow: hidden;"><ul><li> <a href="http://www.boutiqueairmaxfr.com/">Accueil</a> ::
<a href="http://www.boutiqueairmaxfr.com/nike-air-max-247-c-100.html">Nike Air Max 24/7</a> ::
<a href="http://www.boutiqueairmaxfr.com/nike-air-max-247-homme-nike-air-max-247-c-100_103.html">Homme Nike Air Max 24/7</a> ::
Nike Air Max 247 -Homme
</li></ul></div>
要采集的是一里的98,二里的100_103,这种情况用正则如何提取,采集的网站是www.boutiqueairmaxfr.com,各位大侠们可以看看,该怎么处理