火车采集器V2008版更新[2008-08-08][火车车厢管理制度]论坛活跃、奖励计划http://domain.locoy.com火车采集器高级版本在线订购高级版本功能及技术支持列表
返回列表 回复 发帖

求助,正在学正则,如果只想取最后一段字符应该如何写?

试了半天都没能成功。。。
比如我现在采集内容,其中三个页面中要采集的内容分别是这样的:

<div>http://1.name.com/data/200809/duwye.doc</div>

<div>http://2.name.com/data/2008/09/2938.doc</div>

<div>http://dns.name.com/file/2008/09/08/djis_23.doc</div>


我采集发布后的三条内容,只需要

duwye.rar

2938.rar

djis_23.rar

于是想到了正则,只采集内容中最后一个“/”后面的内容,不知道这个规则怎么写呢?希望高手不吝赐教!

[ 本帖最后由 chico 于 2008-12-1 11:30 编辑 ]
干嘛一定要正则的.,普通不是一样可以操作的么
火车头商业版购买与咨询、火车高难度采集、全站采集入库服务、采集规则定制、web在线发布、入库模块定制等业务、大家多多支持呀!联系QQ:86020004
┏┄┄┄┄站长交流中心┄┄┄┄┓
┇ 欢迎大家加入以下群,此群组主要为各位从事计算机爱好者服务欢迎各位高手加盟共同学习QQ群號:7830012  4671518┇
普通的不行啊,比如

<div>http://*/[采集区域]</div>
那么采集下来的就是
data/200809/duwye.doc
data/2008/09/2938.doc
file/2008/09/08/djis_23.doc
在碰到第一个/的时候就OVER了,另外也正好学习学习正则,呵呵!
[a-zA-Z0-9_]+\.doc 自己试一下吧,应该是可以的.


附件: 您所在的用户组无法下载或查看附件
1

评分次数

  • sushy

火车头商业版购买与咨询、火车高难度采集、全站采集入库服务、采集规则定制、web在线发布、入库模块定制等业务、大家多多支持呀!联系QQ:86020004
┏┄┄┄┄站长交流中心┄┄┄┄┓
┇ 欢迎大家加入以下群,此群组主要为各位从事计算机爱好者服务欢迎各位高手加盟共同学习QQ群號:7830012  4671518┇
火车头商业版购买与咨询、火车高难度采集、全站采集入库服务、采集规则定制、web在线发布、入库模块定制等业务、大家多多支持呀!联系
非常感谢您的指点!!!受教了!
返回列表
售前客服QQ: 火车采集器客服 rq204, 火车采集器客服 飞越无限火车采集器客服 孤魂火车采集器客服 尘缘, 联系电话:0551-3495249(技术合作问题) 023-58436018 (08:00-20:00-客服),0752-2553545(09:00-20:00-客服)