求助,正在学正则,如果只想取最后一段字符应该如何写?
试了半天都没能成功。。。比如我现在采集内容,其中三个页面中要采集的内容分别是这样的:
<div>http://1.name.com/data/200809/duwye.doc</div>
<div>http://2.name.com/data/2008/09/2938.doc</div>
<div>http://dns.name.com/file/2008/09/08/djis_23.doc</div>
我采集发布后的三条内容,只需要
duwye.rar
2938.rar
djis_23.rar
于是想到了正则,只采集内容中最后一个“/”后面的内容,不知道这个规则怎么写呢?希望高手不吝赐教!
[ 本帖最后由 chico 于 2008-12-1 11:30 编辑 ] 干嘛一定要正则的.,普通不是一样可以操作的么 普通的不行啊,比如
<div>http://*/[采集区域]</div>
那么采集下来的就是
data/200809/duwye.doc
data/2008/09/2938.doc
file/2008/09/08/djis_23.doc
在碰到第一个/的时候就OVER了,另外也正好学习学习正则,呵呵! +\.doc 自己试一下吧,应该是可以的.
火车头商业版购买与咨询、火车高难度采集、全站采集入库服务、采集规则定制、web在线发布、入库模块定制等业务、大家多多支持呀!联系 非常感谢您的指点!!!受教了!
页:
[1]