sslck 发表于 2008-10-23 10:04:03

正则采集内容,为何不能用这个符号?

要采集内容,使用正则,想使用“|”这个符号,
即设置两个规则,只要其中一个规则满足条件,即进行匹配。
我设置代码形如:
<div id="postmessage">[参数]</div>|<postmessage>[参数]</p>
而组合结果设置为[参数1]

不知这样设置哪里出错了。。。请高手指教?不胜感激。

rq204 发表于 2008-10-23 10:48:32

你这不就正则,正则里是没有参数这个概念的,你可以看一下手册里关于这块的说明

hdmx 发表于 2008-10-23 10:59:29

楼主想采集论坛全部数据?:lol

sslck 发表于 2008-10-23 11:21:52

正则里没有“参数”???
那在选择正则匹配时,不是有“参数”选项么?还有“参数1”。。。2。。。什么的?

aven 发表于 2008-10-23 14:17:11

使用正则时要这样写


(?<content>你的正则表达式?)


后面的组合结果请保持为空

sslck 发表于 2008-10-23 14:35:43

哦,谢楼上,那不知道组合结果上面的“参数1”,参数2。。。是做什么用的?我用
<div id="postmessage">[参数]</div>
组合结果设置为[参数1]
也能采集到内容,为什么?

sslck 发表于 2008-10-23 15:04:16

谁用正则实例????放出来学习下。。。官方手册里怎么有很多是打不开的,目录那里显示?

aven 发表于 2008-10-23 15:19:18

原帖由 sslck 于 2008-10-23 14:35 发表 http://bbs.locoy.com/images/common/back.gif
哦,谢楼上,那不知道组合结果上面的“参数1”,参数2。。。是做什么用的?我用
[参数]
组合结果设置为[参数1]
也能采集到内容,为什么?


你说的这种不是真正的正则!!!

sslck 发表于 2008-10-23 15:23:02

我在上面勾选了“正则匹配”。。。???郁闷中。。
楼上能来个实例么?比如,要采集DISCUZ官方站。。。www.discuz.net,那么正则应怎么写?
页: [1]
查看完整版本: 正则采集内容,为何不能用这个符号?