sunway888 发表于 2010-8-23 11:46:40

标签中如何过滤"“"这样的不规则干扰代码?

有些被采集页面html源代码中有类似:"“","”"这种不规则的干扰字符,该如何去除?如果在内容排除标签中设置"&(*)quo;"不行,因为如果前面有空格代码" "这样&后面会被全部切掉。。。
我用的是免费版,不知现在的其它版本能解决不?建议排除标签中加入优先忽略功能,一般为固定字符串即可。。

sunway888 发表于 2010-8-23 13:21:59

问题解决,原来是双引号问题,替换回来即可
页: [1]
查看完整版本: 标签中如何过滤"“"这样的不规则干扰代码?