正则提取问题!

小茹工作室 发表于 2013-3-14 23:09:54

举例：

      <th>你好</th>
         <td>
            <div class="param_content">
            ..........
            ..........
            </div>

我想先找到你好位置，然后获取后面 <div></div>里的内容

你好文字不固定也可能是您好这里用或 (你好|您好)

测试
(?<content>(你好|您好)[\s\S]*)
格式：正则前字符串(?<content>[\w\W]*?)正则后字符串,其中content是程序用来引用的。

现在判断不了你好和您好您好后面的括号被认为是正则的结尾符号了

按我的情况该如何写，求高手指点！！

303718 发表于 2013-3-14 23:20:27

那你还不如用这种好</th>(*)<div class="param_content">[参数]</div>

小茹工作室 发表于 2013-3-14 23:24:59

303718 发表于 2013-3-14 23:20 static/image/common/back.gif
那你还不如用这种

首先感谢您的回复，可能我举例有点问题
那个位置每个字都不相同的，可能是你好可能是请问这类的，最后一个字不一样的。我只是举例正好末尾那个字一样了。。
这样的怎么写

303718 发表于 2013-3-15 00:02:15

如果有长有短又不同只好用别的HTML标签来做开始结束标记了

小茹工作室 发表于 2013-3-15 12:40:04

303718 发表于 2013-3-15 00:02 static/image/common/back.gif
如果有长有短又不同只好用别的HTML标签来做开始结束标记了

是的有长有短。。。别的HTML标签就相同。。。看来我只能把所有的情况都写成一个标签，符合的采集到内容，不符合的采集为空。。。怎么能忽略采集为空的标签？发布的时候。

小茹工作室 发表于 2013-3-15 12:40:45

caijiao123 发表于 2013-3-15 10:53 static/image/common/back.gif
帮不上忙，帮顶顶。。。

{:4_180:} 顶顶更健康

页: [1]

火车采集器软件交流官方论坛's Archiver

正则提取问题!