火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 20170|回复: 8

谁能告诉我 火车头的正则提取怎么用啊

[复制链接]
发表于 2012-3-15 20:15:05 | 显示全部楼层 |阅读模式
谁能告诉我 火车头的正则提取怎么用啊
发表于 2012-3-23 21:33:00 | 显示全部楼层
{:soso_e144:}很好搞的,比如  http://www.fajue.net/apk/ditu/dianzi/baidumap.html 这个网站
           <li><strong>软件大小:</strong>4.68 MB</li><tr><th colspan=2>TAG标签:发掘网</th></tr>
            <li><strong>软件版本:</strong>V2.1.0  </li> 我想要把软件大小的 4.68 MB 和软件版本 V2.1.0 弄到一个标题里,这个标题就是 ”4.68 MB  V2.1.0“  那么我们怎么去用操作呢,其实很简单[参数]这个指得到的结果 (*)这里是过滤中间不一样的东东:<tr><th colspan=2>TAG标签:发掘网</th></tr>比如这个标签不同的内容页,标签就不一样,可以用(*)过滤。
正规式如下:
正规内容为 <li><strong>软件大小:</strong>[参数]</li>tr><th colspan=2>TAG标签:(*)</th></tr>
            <li><strong>软件版本:</strong>[参数]</li>

组合结果:[参数1] [参数2] 这里的参数1、2是按正规内容里的参数顺序排列的,中间可加其它的东东,比如加上 [参数1] 发掘网站[参数2]
那么输出的结果就是4.68 MB 发掘网站V2.1.0
懂了吗,会了吗
发表于 2012-4-2 15:44:57 | 显示全部楼层
联系QQ:
发表于 2012-5-6 09:19:40 | 显示全部楼层
过来学习了……

正则规则 我也不懂呢……
发表于 2012-5-24 08:15:16 | 显示全部楼层
总算看明白了,谢谢楼主
发表于 2012-5-24 09:15:10 | 显示全部楼层
这个偶也会了,说白了就是找不一样的参数用公共(*)代替即可
发表于 2012-5-24 09:24:50 | 显示全部楼层
正则匹配:1.就是楼上说的参数匹配
          2.(?<content>[\s\S]*?) 就是用这种格式的正则表达式
发表于 2012-5-25 09:46:21 | 显示全部楼层
fajue 发表于 2012-3-23 21:33
很好搞的,比如  http://www.fajue.net/apk/ditu/dianzi/baidumap.html 这个网站
           ...

讲的太好了  简明扼要 总算是了解个大概了
发表于 2012-12-13 15:18:19 | 显示全部楼层
过来围{:soso_e124:}观学习ing
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-10 03:00

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表