发新话题
打印

[3.2版] 过滤某段文字前边和后边的字符 只保留中间5个字符的正则怎么写

过滤某段文字前边和后边的字符 只保留中间5个字符的正则怎么写

比如这段话  售价: 最高 5 节火车车厢  只保留最高 2字 其它的空格和文字都过滤掉 这个正则怎样写 

TOP

有点复杂了。
售价: 最高 5
一个引号开始,一个字符结束,这样好写一些
\w\w\s\d
因为中间有空格,呵呵

[ 本帖最后由 杨大爷 于 2008-1-12 01:09 编辑 ]
本帖最近评分记录
  • vus520 活跃度 +10 测试正确! 2008-1-12 17:42
  • vus520 火车车厢 +5 测试正确! 2008-1-12 17:42
~~中国国家足球队~~

TOP

如果要用火车进行采集,格式是这样的

开始代码(系统正则表达)结束代码
本句正则为 售价: (?<content>\w\w\s\d)

[ 本帖最后由 vus520 于 2008-1-12 18:02 编辑 ]
本帖最近评分记录
火车采集器商业版 咨询、购买、售后支持等 :
火车采集器2008版系列教程正在陆续发布中 :  点击观看
提供高难度采集技术支持,完美实现全站转移,多栏目自动更新
火车采集器采集规则定制:[50元/条,质量保证]
火车采集器发布模块定制:[80元/条,质量保证]
火车采集器程序接口定制:[按程序难度议价,200起]
织梦图片集自动发布模块:[100元/个,自动分析图片代码、远程下载图片]
支持支付宝淘宝安全交易:Q Q: 130775 Mail:vu520@163.com ->查看更多联系方式

TOP

学习。。。。。。

TOP

呵呵
"只保留中间5个字符......"这样好像不行,因为不能确定两边的字符数量。

只取前边几个字符就可以。

以这个网页的标题为例:http://sports.qq.com/a/20080610/000586.htm

只取前边18个汉字(字母、符号或空格)就是:
<title>(?<content>[\w\W]{0,18}).*</title>
(如果标题字符不足18个就取全部)

只取后边几个字符就比较复杂了

[ 本帖最后由 ws123 于 2008-6-10 19:59 编辑 ]

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.130400 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-16 15:21 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档