火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2604|回复: 5

求助,正在学正则,如果只想取最后一段字符应该如何写?

[复制链接]
发表于 2008-12-1 11:27:34 | 显示全部楼层 |阅读模式
试了半天都没能成功。。。
比如我现在采集内容,其中三个页面中要采集的内容分别是这样的:

<div>http://1.name.com/data/200809/duwye.doc</div>

<div>http://2.name.com/data/2008/09/2938.doc</div>

<div>http://dns.name.com/file/2008/09/08/djis_23.doc</div>


我采集发布后的三条内容,只需要

duwye.rar

2938.rar

djis_23.rar

于是想到了正则,只采集内容中最后一个“/”后面的内容,不知道这个规则怎么写呢?希望高手不吝赐教!

[ 本帖最后由 chico 于 2008-12-1 11:30 编辑 ]
发表于 2008-12-1 11:34:10 | 显示全部楼层
干嘛一定要正则的.,普通不是一样可以操作的么
 楼主| 发表于 2008-12-1 11:37:52 | 显示全部楼层
普通的不行啊,比如

<div>http://*/[采集区域]</div>
那么采集下来的就是
data/200809/duwye.doc
data/2008/09/2938.doc
file/2008/09/08/djis_23.doc
在碰到第一个/的时候就OVER了,另外也正好学习学习正则,呵呵!
发表于 2008-12-1 11:46:54 | 显示全部楼层
[a-zA-Z0-9_]+\.doc 自己试一下吧,应该是可以的.


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

1

查看全部评分

发表于 2008-12-1 11:58:20 | 显示全部楼层
火车头商业版购买与咨询、火车高难度采集、全站采集入库服务、采集规则定制、web在线发布、入库模块定制等业务、大家多多支持呀!联系
 楼主| 发表于 2008-12-1 15:40:42 | 显示全部楼层
非常感谢您的指点!!!受教了!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-23 16:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表