火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3273|回复: 6

正则提取内容为空,截图求助

[复制链接]
发表于 2014-11-14 11:52:12 | 显示全部楼层 |阅读模式
研究了很久,解决不了,求助版主和浏览帖子的各位老师
我想从网址   http://lhb.hermes.hexun.com/lhb.aspx?date=2006-08-14   中采集日期“2006-08-14 ”
用了如下的正则提取,结果[标签:日期]采集到的内容为空。
http://lhb.hermes.hexun.com/lhb.aspx?date=(?<content>[\s\S]*?)$
我错在哪里呢,请版主和各位老师指导


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2014-11-14 12:01:10 | 显示全部楼层
date=(?<content>[\s\S]*?)$
 楼主| 发表于 2014-11-14 12:43:53 | 显示全部楼层
我用的是8.4免费版本
 楼主| 发表于 2014-11-14 12:44:26 | 显示全部楼层
顶起,请懂的老师详细点指导
发表于 2014-11-14 13:22:38 | 显示全部楼层
自由心 发表于 2014-11-14 12:44
顶起,请懂的老师详细点指导

很简单,勾选在网址中匹配,其它的不需要勾选














『采集超市』专注于火车头规则、插件、模块、接口等周边产品开发!为企业和个人提供全方位的采集发布方案!
联系QQ:
官方网站:www.locoymall.com

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2015-2-5 23:46:26 | 显示全部楼层
来学学习的
发表于 2015-2-5 23:50:09 | 显示全部楼层
因为时间标签很多,所以需要写个通配的格式,来循环匹配

时间格式   2013-06-06 22:14

正规正则表达式 格式 \d{4}-\d{2}-\d{2} \d{2}:\d{2}

这里不要问 为什么会这样写,如果看不明白的,可以看下正则的标准语法,

教程如下http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx

在我们的采集器里 应该这样写 (?<content>\d{4}-\d{2}-\d{2} \d{2}:\d{2})

把我们的表达式 (?<content>[\s\S]*?) 里面的  [\s\S]*? 替换成自己的表达式即可。这样结果就返回了 我们设置的正则格式的结果
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 06:47

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表