|
|
发表于 2008-10-9 13:12:10
|
显示全部楼层
我也有这样的感觉,弄不懂火车里的正则。
我用正则测试器通过了为什么还是采集不到数据呢
要从网页里提取 像这样规律的字符串 ,我写了三个正则表达式正确通过正则测试,但是不知道为什么用火车头就是采集不到我想要的数据
字符串举例 特点 2个或者3个汉字,一个空格,六个无论大小写的英文字符,两位数的数字
比如 丁大丁 tkipCS21
[\u4E00-\u9FA5]{2,3}[ ][A-Za-z]{6}\d{2}
(\W{2,3}[ ][A-Z|a-z]{6}\d{2})
\W{2,3} [A-Z|a-z]{6}\d{2}
这三个正则 都用表达式验证工具验证过了 但是按照下面两个 方式 写在 正则匹配内容的框里就不行 也不知道为什么
开始代码(?<content>正则表达式)结束代码
或
开始代码(?<content>正则表达式?)结束代码
标签仍然得不到我想要的字符串 |
|