火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2805|回复: 7

如何按一定规则排除不想要的字符串

[复制链接]
发表于 2012-8-1 18:16:21 | 显示全部楼层 |阅读模式
请问高手,我有个标签获得了字串art/UploadFiles_4444/艺术教育/书法/其他/少儿学书法

我要去掉最后一个斜杠/和后面的内容,怎么设置数据处理?
发表于 2012-8-2 09:05:54 | 显示全部楼层
可以使用内容替换,将想删除的内容替换为空
 楼主| 发表于 2012-8-2 11:20:23 | 显示全部楼层
1033736011 发表于 2012-8-2 09:05
可以使用内容替换,将想删除的内容替换为空

恩,我知道,关键是怎么设置,用通配符(*)去替换时,总是只能获得第一个“/”之前的内容。上面的例子就只能获得art

而我想要得到的是只去掉最后一个斜杠和之后的内容
 楼主| 发表于 2012-8-2 11:27:17 | 显示全部楼层
再具体说,我实际上用了两个标签,一个标签补全URL用来做文件下载,另一个标签获得这个文件的URL路径用于指定下载存放的目录,这样下载的文件自动存放到不同的目录中了,但是这个路径是连着文件名的,我最多把文件扩展名去掉了,导致每个下载的文件都存在一个单独的目录中。
例如:
art/UploadFiles_4444/艺术教育/书法/其他/少儿学书法实际我下载的是http://****.**.**/art/UploadFiles_4444/艺术教育/书法/其他/少儿学书法.扩展名下载成功了,却存放在art/UploadFiles_4444/艺术教育/书法/其他/少儿学书法文件夹下,我想每个采集到的文件只存放在art/UploadFiles_4444/艺术教育/书法/其他下,这样不会一个文件生成一个文件夹,那么就要处理掉最后一个斜杠和内容,如何写?


发表于 2012-8-3 08:24:34 | 显示全部楼层
用内容替换将“/少儿学书法”替换为空

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2012-8-3 09:40:31 | 显示全部楼层
可以使用参数替换功能

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2012-8-3 09:46:18 | 显示全部楼层
开起来很麻烦的样子!
 楼主| 发表于 2012-8-4 14:57:34 | 显示全部楼层
wxl08 发表于 2012-8-3 09:40
可以使用参数替换功能

这个方法是我想要的,THANK YOU!不过有点缺陷,当目录级数相同的时候这个方法OK,但是下载内容所在目录深度不一样的时候,只能存到指定参数个数的目录深度上,能解决这个问题吗?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-16 09:36

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表