火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4257|回复: 2

建议:《内容过滤》 - <HTML标签排除> 里面增加自定义要排除的标签

[复制链接]
发表于 2010-4-21 12:09:00 | 显示全部楼层 |阅读模式
本帖最后由 cainew 于 2010-4-21 12:10 编辑

比如:
今天采集一篇文章的时候,我发现过滤了链接,但是下划线并没有过滤掉,请看下图,


有人说在内容排除里面加上一个排除项“<i>(*)</i>,这样是不对的,会过滤掉上图中的股市两个字。

也欢迎大家探讨一下,看看是不是有别的解决办法。

个人认为,《内容过滤》 - <HTML标签排除> 里面增加自定义要排除的标签,是很有必要的,支持的顶。

PS: 我用的是2010的最新版

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-4-21 21:40:35 | 显示全部楼层
你分两次过滤不就行了  <i>  和 </i>
发表于 2016-2-9 00:34:59 | 显示全部楼层
历史帖子回顾中。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 22:07

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表