火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3983|回复: 4

过滤某段文字前边和后边的字符 只保留中间5个字符的正则怎么写

[复制链接]
发表于 2008-1-12 00:23:44 | 显示全部楼层 |阅读模式
比如这段话  售价: 最高 5 节火车车厢  只保留最高 2字 其它的空格和文字都过滤掉 这个正则怎样写 
发表于 2008-1-12 01:04:46 | 显示全部楼层
有点复杂了。
售价: 最高 5
一个引号开始,一个字符结束,这样好写一些
\w\w\s\d
因为中间有空格,呵呵

[ 本帖最后由 杨大爷 于 2008-1-12 01:09 编辑 ]

评分

1

查看全部评分

发表于 2008-1-12 17:55:04 | 显示全部楼层
如果要用火车进行采集,格式是这样的

开始代码(系统正则表达)结束代码
本句正则为 售价: (?<content>\w\w\s\d)

[ 本帖最后由 vus520 于 2008-1-12 18:02 编辑 ]

评分

1

查看全部评分

发表于 2008-6-9 15:10:57 | 显示全部楼层
学习。。。。。。
发表于 2008-6-10 18:34:37 | 显示全部楼层
呵呵
"只保留中间5个字符......"这样好像不行,因为不能确定两边的字符数量。

只取前边几个字符就可以。

以这个网页的标题为例:http://sports.qq.com/a/20080610/000586.htm

只取前边18个汉字(字母、符号或空格)就是:
<title>(?<content>[\w\W]{0,18}).*</title>
(如果标题字符不足18个就取全部)

只取后边几个字符就比较复杂了

[ 本帖最后由 ws123 于 2008-6-10 19:59 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-19 05:35

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表