火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2354|回复: 2

[已解决]问一个关于多行正则替换的问题,还请各位前辈赐教

[复制链接]
发表于 2013-2-5 18:07:27 | 显示全部楼层 |阅读模式
本帖最后由 saga65 于 2013-2-5 19:58 编辑

我需要对采集下来的数据进行一次处理,因此我在火车头的内容采集页面添加了一个正则替换的处理规则

<p class="aaa">...</p>替换成<pre class="bbb">....</pre>

经过测试

<p\s+class="aaa">(.*[^<\/p>])<\/p>
替换成
<pre class="bbb">$1</pre>
在单行的情况下是工作的

但是对于这样的多行内容就无效了

<p class="aaa"># xx ..<br>
  # xxx xxx xxxxxxxxxxxxxxx<br>
  # xx xxxxxxxxxxxxxxxx<br>
  # xxxxxx<br>
  # xxxx<br>
# xxxxxxxx</p>

我也试过<p\s+class="aaa">([.\s\S]*[^<\/p>])<\/p>
在.NET 正则表达式的测试页面是可以的,但是放在火车头里依旧不行

我正则表达式水平一般,还请各位前辈赐教


发表于 2013-2-5 19:44:23 | 显示全部楼层
你可以试试这种
  1. <p class="aaa">[参数]</p>
复制代码
 楼主| 发表于 2013-2-5 19:53:09 | 显示全部楼层
谢谢了,问题解决,按照你的方法,原来可以直接用内容替换即可,不需要纯正则表达式
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-15 14:43

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表