火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3787|回复: 5

练习使用正则式采集,采集测试结果是:${content}

[复制链接]
发表于 2008-1-6 02:22:25 | 显示全部楼层 |阅读模式
练习使用正则式采集,采集测试结果是:${content}

想要得到的采集内容却没有出现。

用正则式测试器测试我的正则式,我的正则式是正确的,可以匹配到我要的内容。

看了老大的教程,${content} 这个应该是火车头软件内置的参数,应该怎样正确把这个参数转换成内容呢?是不是有什么特殊的格式写法,才能把${content}这个参数的内容写出来?

看了几遍老大的正则采集视频,还是不明白这个${content}参数的正确用法。请老大帮忙解答一下,谢谢
发表于 2008-1-6 10:15:01 | 显示全部楼层
好像是(?<content>.*?) 吧。
 楼主| 发表于 2008-1-6 19:04:17 | 显示全部楼层
已经自己学习正则式的资料搞定了。
假设正则式是:  abcdefg
那么这个隐藏参数应该这样用: (?<content>abcdefg)
前后的括号是一定要写的。
意思是把 abcdefg   这个表达式捕获的文本分配到 组名为   content  的分组中。
也许我的意思没有讲得很清楚,不过这样写已经可以正确获得我需要采的内容了。

也谢谢热心的 rq204
发表于 2008-1-6 20:47:54 | 显示全部楼层
路过
发表于 2008-1-7 12:38:33 | 显示全部楼层
是这样啊..我还以为我写错了..遇到过..顶一下.
发表于 2008-6-9 15:20:53 | 显示全部楼层
呵呵
在标签中用正则表达式采内容的格式是这样:

开始代码(?<content>正则表达式)结束代码

开始代码(?<content>正则表达式?)结束代码

其中在开始代码和结束代码中如有需要转义的字符就要用\转义。
右边的"组合结果"项留空即可。
已经测试通过。

[ 本帖最后由 ws123 于 2008-6-9 19:31 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-18 16:31

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表