火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3340|回复: 0

[程序BUG]怀疑“编辑web发布设置”有问题

[复制链接]
发表于 2008-2-21 00:27:49 | 显示全部楼层 |阅读模式
说明:
 =&+n+b+s+p+;
不能在论坛帖内连起来,一连起来是代表不间断空白,ASCII码值为160,实际操作要把以下全角的改为半角。

===========正文=============

在新浪博客发布时,内容为“<div>&nbsp;div>",发布后总是变成空的!

检查采集的内容,的确包含了“&nbsp;”,为什么发布后就会没有了?

而且新浪的博客可能会删除以下内容: <div></div>

结果发布内容变成空的。

检查:
1.分析新浪博客发布
通过火车采集器功能-自动抓取发布数据包,
在内置微型浏览器中输入以下网址http://my.blog.sina.com.cn//writing/scriber/article_add.php?mode=1
点击显示代码
输入内容为
<div>&nbsp;</div>
<div>&nbsp;</div>
<div>&nbsp;</div>
<div>&nbsp;</div>
点击发表文章
返回查看火车抓取的发布数据包,正常
检查新浪博客文章源文件,正常

2.在火车“web发布设置”中选择“测试配置”
修改“内容”标签,改为
<div>&nbsp;</div>
<div>&nbsp;</div>
<div>&nbsp;</div>
<div>&nbsp;</div>
“时间”标签,改为不带日期
点击“发表文章测试”,返回成功发布信息
检查新浪博客文章,内容为空。

分析:
原来发的内容是:<div>&nbsp;</div>
可能在火车发布时删除了&nbsp;,或者对&nbsp;转化了一下,导致发布的实际内容变成了<div></div>
然后新浪博客显示文章时可能过滤了<div></div>

是不是火车在发布时过滤了内容?

再在Discuz! 6.0测试,
发布内容一样,同样在火车“web发布设置”中选择“测试配置”,查Discuz! 6.0 的帖子内容变为 <div>

也就是说:大量字符被火车发布时过滤了。


综合两种测试方式,分析确认是火车有问题,不能发布带有“&nbsp;”的内容。
是不是UBB转换有问题?因为UBB转换是二选一,必须转换,不转换不可以,选择HTML也一样过滤,所以发布内容被过滤了重要内容?



[ 本帖最后由 jacksoon 于 2008-2-21 00:33 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 00:09

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表