火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1985|回复: 3

时间和来源之间没有任何间隔的情况下如何分开采集呀?

[复制链接]
发表于 2013-3-26 13:16:16 | 显示全部楼层 |阅读模式
代码:
<div class="time">2013-03-22 08:17:00
                                本网 </div>

来源:http://www.gd.gov.cn/gdgk/gdyw/201303/t20130322_176527.htm



这种情况下,用空格来区分时间和来源是不行的。请问怎么才能分开采集呢?
 楼主| 发表于 2013-3-26 13:26:32 | 显示全部楼层
已解决了
发表于 2013-3-26 14:37:59 | 显示全部楼层
用纯正则提取


  1. [\w\W]*(\d{4}-\d{2}-\d{2}[ ]\d{2}:\d{2}:\d{2})[\w\W]*
复制代码
  1. $1
复制代码

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-3-30 02:20:31 | 显示全部楼层
谢谢楼上的解答。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-15 09:57

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表