发新话题
打印

[2008版] 我用正则测试器通过了为什么还是采集不到数据呢

我用正则测试器通过了为什么还是采集不到数据呢

要从网页里提取 像这样规律的字符串 ,我写了三个正则表达式正确通过正则测试,但是不知道为什么用火车头就是采集不到我想要的数据

  字符串举例   特点  2个或者3个汉字,一个空格,六个无论大小写的英文字符,两位数的数字

   比如      丁大丁 tkipCS21

[\u4E00-\u9FA5]{2,3}[ ][A-Za-z]{6}\d{2}

                  (\W{2,3}[ ][A-Z|a-z]{6}\d{2})

                     \W{2,3} [A-Z|a-z]{6}\d{2}

这三个正则 都用表达式验证工具验证过了  但是按照下面两个 方式 写在 正则匹配内容的框里就不行 也不知道为什么
开始代码(?<content>正则表达式)结束代码

开始代码(?<content>正则表达式?)结束代码   

标签仍然得不到我想要的字符串

TOP

结束代码

去掉试试
各种采集器或cms自带采集
同一IIS下建多站点组件(虚拟主机也适用)
采集规则/发布模块制作
全站采集代采   
采集指导
Q在左上

TOP

看视频网站有感

我来看看.





















图片成人黄色22CCC

[ 本帖最后由 332111 于 2008-10-8 19:42 编辑 ]

TOP

还是不行啊

我试了去掉结束代码,还是不行啊

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.208859 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 08:24 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档