heidian 发表于 2006-12-16 11:21:41

<SPAN标签和class=有问题(已解决)

我采集这个页面的正文部分:
http://www.tingxs.com/Article/xstw/xswb/0956592800.htm

开始字符串:<!--正文-->
结束字符串:</TD>
          </TR>
      </TBODY>
      </TABLE>
      <TABLE cellSpacing=0 cellPadding=0 width="98%" border=0>

得到的结果无论我是否过滤,有没有替换,"<SPAN" 必然会变成"< AN",对应的</SPAN也成了</ AN

class也有这种情况,似乎是ss自动被替换成空格。

3.0和3.01都试了,清除所有过滤字符串也这样。

[ 本帖最后由 heidian 于 2006-12-18 20:24 编辑 ]

srsman 发表于 2006-12-17 00:46:26

heidian 发表于 2006-12-18 20:29:24

出现以下错误的原因是同时开启了“空格”标签的过滤,可能是&nbsp这个代码引出的问题,因为被错误过滤的也就是s p两个字母。

<P cla =MsoNormal>(应该是<P class=MsoNormal>)
< AN>(应该是SPAN)

这个问题出现的概率不一样,但是在出现问题后,跟空格过滤的选项却有必然联系,可能是个BUG。手工另外指定空格代码过滤没问题

[ 本帖最后由 heidian 于 2006-12-18 20:59 编辑 ]

c124128 发表于 2006-12-20 12:41:09

是的.过滤 空格 标签 会出现很多问题的.所以俺都不过滤空格标签了.
页: [1]
查看完整版本: <SPAN标签和class=有问题(已解决)