火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2553|回复: 8

正则采集内容,为何不能用这个符号?

[复制链接]
发表于 2008-10-23 10:04:03 | 显示全部楼层 |阅读模式
要采集内容,使用正则,想使用“|”这个符号,
即设置两个规则,只要其中一个规则满足条件,即进行匹配。
我设置代码形如:
<div id="postmessage">[参数]</div>|<postmessage>[参数]</p>
而组合结果设置为[参数1]


不知这样设置哪里出错了。。。请高手指教?不胜感激。
发表于 2008-10-23 10:48:32 | 显示全部楼层
你这不就正则,正则里是没有参数这个概念的,你可以看一下手册里关于这块的说明
发表于 2008-10-23 10:59:29 | 显示全部楼层
楼主想采集论坛全部数据?
 楼主| 发表于 2008-10-23 11:21:52 | 显示全部楼层
正则里没有“参数”???
那在选择正则匹配时,不是有“参数”选项么?还有“参数1”。。。2。。。什么的?
发表于 2008-10-23 14:17:11 | 显示全部楼层
使用正则时要这样写


(?<content>你的正则表达式?)


后面的组合结果请保持为空
 楼主| 发表于 2008-10-23 14:35:43 | 显示全部楼层
哦,谢楼上,那不知道组合结果上面的“参数1”,参数2。。。是做什么用的?我用
<div id="postmessage">[参数]</div>
组合结果设置为[参数1]
也能采集到内容,为什么?
 楼主| 发表于 2008-10-23 15:04:16 | 显示全部楼层
谁用正则实例????放出来学习下。。。官方手册里怎么有很多是打不开的,目录那里显示?
发表于 2008-10-23 15:19:18 | 显示全部楼层
原帖由 sslck 于 2008-10-23 14:35 发表
哦,谢楼上,那不知道组合结果上面的“参数1”,参数2。。。是做什么用的?我用
[参数]
组合结果设置为[参数1]
也能采集到内容,为什么?



你说的这种不是真正的正则!!!
 楼主| 发表于 2008-10-23 15:23:02 | 显示全部楼层
我在上面勾选了“正则匹配”。。。???郁闷中。。
楼上能来个实例么?比如,要采集DISCUZ官方站。。。www.discuz.net,那么正则应怎么写?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 18:44

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表