火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1710|回复: 2

付费找人写规则

[复制链接]
发表于 2010-12-17 07:52:56 | 显示全部楼层 |阅读模式
源码是这样的

<h4 class="no-display">You're currently on:</h4>
<ul class="breadcrumbs">
            <li class="home">
                    <a href="http://www.buyluxurybrands.net/" title="Louis Vuitton">Louis Vuitton</a>
                </li>
                <li> > </li>
                    <li class="category225">
                    <a href="http://www.buyluxurybrands.net/louis-vuitton.html" title="">LOUIS VUITTON</a>
                </li>
                <li> > </li>
                    <li class="category226">
                    <a href="http://www.buyluxurybrands.net/louis-vuitton/women.html" title="">WOMEN</a>
                </li>
                <li> > </li>
                    <li class="category234">
                    <a href="http://www.buyluxurybrands.net/louis-vuitton/women/belts-scarves-accessories.html" title="">Belts,Scarves & Accessories</a>
                </li>
                <li> > </li>
                    <li class="product">
                    ELLIPSD DAMIER BELT                </li>
            </ul>

我想采集 title="">这里的内容</a>  这个title=""在整个页面就3个 我就想采集这3个后面的文字   用循环匹配采集
想要的采集结果应该是这样 LOUIS VUITTON|||WOMEN|||Belts,Scarves & Accessories

我写的正则式这样的title="">[参数]</a> 可是怎么采集都是空白
请各位高人指点下 如何写正则  

网页地址是这个 http://www.buyluxurybrands.net/ellipsd-damier-belt.html
发表于 2010-12-17 09:24:32 | 显示全部楼层
你好。联系QQ906815180
发表于 2010-12-17 09:45:03 | 显示全部楼层
可以采集的 有需要的话联系我定制~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-19 03:43

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表