火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3299|回复: 4

如何过滤文章内指定的<a 标记,但要保留其他的<a

[复制链接]
发表于 2008-7-27 10:33:57 | 显示全部楼层 |阅读模式
我要采集的原文内有这样的链接是我要过滤掉,只保留文字就行了 (视频,编解码器)

<A href="/SEARCH/ART/视频.HTM"   target="_blank">视频</A>
<A href="/SEARCH/ART/编解码器.HTM"   target="_blank">编解码器</A>

但文章内还有别的比如下面的链接,这个链接我是要保留的,请问如何处理这样的情况?

<A HREF="/2006OCT/PDF/Design_Of_an_Efficient_MPEG_processor.pdf?SOURCES=DOWNLOAD" target="blank">下载PDF格式全文</A>
发表于 2008-7-27 11:01:07 | 显示全部楼层

可以用正则直接去掉

可以用正则直接去掉
 楼主| 发表于 2008-7-27 11:19:23 | 显示全部楼层
正则怎么写啊,能不能举个例子
发表于 2008-7-28 07:30:22 | 显示全部楼层
笨方法: 直接排除掉
<A href="/SEARCH/(*)HTM"   target="_blank">
视频</A>这个替换成视频

这方法够笨吧
发表于 2008-7-28 16:00:05 | 显示全部楼层
支持下 楼上的方法很通俗实在 ~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-20 15:45

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表