火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4813|回复: 3

<SPAN标签和class=有问题(已解决)

[复制链接]
发表于 2006-12-16 11:21:41 | 显示全部楼层 |阅读模式
我采集这个页面的正文部分:
http://www.tingxs.com/Article/xstw/xswb/0956592800.htm

开始字符串:<!--正文-->
结束字符串:</TD>
          </TR>
        </TBODY>
      </TABLE>
      <TABLE cellSpacing=0 cellPadding=0 width="98%" border=0>

得到的结果无论我是否过滤,有没有替换,"<SPAN" 必然会变成"< AN",对应的</SPAN也成了</ AN

class也有这种情况,似乎是ss自动被替换成空格。

3.0和3.01都试了,清除所有过滤字符串也这样。

[ 本帖最后由 heidian 于 2006-12-18 20:24 编辑 ]
srsman 该用户已被删除
发表于 2006-12-17 00:46:26 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2006-12-18 20:29:24 | 显示全部楼层
出现以下错误的原因是同时开启了“空格”标签的过滤,可能是&nbsp这个代码引出的问题,因为被错误过滤的也就是s p两个字母。

<P cla =MsoNormal>(应该是<P class=MsoNormal>)
< AN>(应该是SPAN)

这个问题出现的概率不一样,但是在出现问题后,跟空格过滤的选项却有必然联系,可能是个BUG。手工另外指定空格代码过滤没问题

[ 本帖最后由 heidian 于 2006-12-18 20:59 编辑 ]
发表于 2006-12-20 12:41:09 | 显示全部楼层
是的.过滤 空格 标签 会出现很多问题的.所以俺都不过滤空格标签了.
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 11:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表