火车采集器软件交流官方论坛's Archiver
论坛
›
采集器基础使用讨论区
› 标签中如何过滤"“"这样的不规则干扰代码?
sunway888
发表于 2010-8-23 11:46:40
标签中如何过滤"“"这样的不规则干扰代码?
有些被采集页面html源代码中有类似:"“","”"这种不规则的干扰字符,该如何去除?如果在内容排除标签中设置"&(*)quo;"不行,因为如果前面有空格代码" "这样&后面会被全部切掉。。。
我用的是免费版,不知现在的其它版本能解决不?建议排除标签中加入优先忽略功能,一般为固定字符串即可。。
sunway888
发表于 2010-8-23 13:21:59
问题解决,原来是双引号问题,替换回来即可
页:
[1]
查看完整版本:
标签中如何过滤"“"这样的不规则干扰代码?