fajue 发表于 2012-3-23 21:33:38

给大家分享一下怎么使用火车采集器的正则

本帖最后由 fajue 于 2012-3-23 21:37 编辑

{:soso_e144:}很好搞的,比如http://www.fajue.net/apk/ditu/dianzi/baidumap.html 这个网站
         <li><strong>软件大小:</strong>4.68 MB</li><tr><th colspan=2>TAG标签:发掘网</th></tr>
            <li><strong>软件版本:</strong>V2.1.0</li> 我想要把软件大小的 4.68 MB 和软件版本 V2.1.0 弄到一个标题里,这个标题就是 ”4.68 MBV2.1.0“那么我们怎么去用操作呢,其实很简单[参数]这个指得到的结果 (*)这里是过滤中间不一样的东东:<tr><th colspan=2>TAG标签:发掘网</th></tr>比如这个标签不同的内容页,标签就不一样,可以用(*)过滤。
正规式如下:
正规内容为 <li><strong>软件大小:</strong>[参数]</li>tr><th colspan=2>TAG标签:(*)</th></tr>
            <li><strong>软件版本:</strong>[参数]</li>

组合结果:[参数1] [参数2] 这里的参数1、2是按正规内容里的参数顺序排列的,中间可加其它的东东,比如加上 [参数1] 发掘网站[参数2]
那么输出的结果就是4.68 MB 发掘网站V2.1.0
懂了吗,会了吗

shuilijue 发表于 2012-4-2 15:44:51

精通采集 联系QQ:http://wpa.qq.com/pa?p=2:972130397:47
页: [1]
查看完整版本: 给大家分享一下怎么使用火车采集器的正则