<SPAN标签和class=有问题(已解决)
我采集这个页面的正文部分:http://www.tingxs.com/Article/xstw/xswb/0956592800.htm
开始字符串:<!--正文-->
结束字符串:</TD>
</TR>
</TBODY>
</TABLE>
<TABLE cellSpacing=0 cellPadding=0 width="98%" border=0>
得到的结果无论我是否过滤,有没有替换,"<SPAN" 必然会变成"< AN",对应的</SPAN也成了</ AN
class也有这种情况,似乎是ss自动被替换成空格。
3.0和3.01都试了,清除所有过滤字符串也这样。
[ 本帖最后由 heidian 于 2006-12-18 20:24 编辑 ] 出现以下错误的原因是同时开启了“空格”标签的过滤,可能是 这个代码引出的问题,因为被错误过滤的也就是s p两个字母。
<P cla =MsoNormal>(应该是<P class=MsoNormal>)
< AN>(应该是SPAN)
这个问题出现的概率不一样,但是在出现问题后,跟空格过滤的选项却有必然联系,可能是个BUG。手工另外指定空格代码过滤没问题
[ 本帖最后由 heidian 于 2006-12-18 20:59 编辑 ] 是的.过滤 空格 标签 会出现很多问题的.所以俺都不过滤空格标签了.
页:
[1]