|
源码是这样的
<h4 class="no-display">You're currently on:</h4>
<ul class="breadcrumbs">
<li class="home">
<a href="http://www.buyluxurybrands.net/" title="Louis Vuitton">Louis Vuitton</a>
</li>
<li> > </li>
<li class="category225">
<a href="http://www.buyluxurybrands.net/louis-vuitton.html" title="">LOUIS VUITTON</a>
</li>
<li> > </li>
<li class="category226">
<a href="http://www.buyluxurybrands.net/louis-vuitton/women.html" title="">WOMEN</a>
</li>
<li> > </li>
<li class="category234">
<a href="http://www.buyluxurybrands.net/louis-vuitton/women/belts-scarves-accessories.html" title="">Belts,Scarves & Accessories</a>
</li>
<li> > </li>
<li class="product">
ELLIPSD DAMIER BELT </li>
</ul>
我想采集 title="">这里的内容</a> 这个title=""在整个页面就3个 我就想采集这3个后面的文字 用循环匹配采集
想要的采集结果应该是这样 LOUIS VUITTON|||WOMEN|||Belts,Scarves & Accessories
我写的正则式这样的title="">[参数]</a> 可是怎么采集都是空白
请各位高人指点下 如何写正则
网页地址是这个 http://www.buyluxurybrands.net/ellipsd-damier-belt.html |
|