火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3061|回复: 4

关于发布时出现问号的处理办法

[复制链接]
发表于 2009-7-19 14:04:52 | 显示全部楼层 |阅读模式
有的朋友在采集了一些数据后,发布到自己的网站时,会发现原来一些空白字符变成了问号.例如:

http://bbs.locoy.com/viewthread.php?tid=39448&highlight=%BF%D5%B8%F1


此问题和采集器程序无关,是由于对方网页里的字符编码你的网站无法识别造成,你可以在发布时抓取数据包,程序是完整的将数据发布上去了,只是你网站的编码里无法识别,所以就显示成了?.

此问题的解决办法是采集器中直接过滤,但考虑到手工处理相对麻烦,所以新版本打算直接进行过滤.但因为导致?问号的可能不止是一个字符,所以希望大家提交自己的此类问题的网址网站,你要做的是,我们以 http://www.yeeyan.com/articles/view/lovedzc/2852 为例:

1.在网页上右键,查看源代码.将出现源码的文本.
2.选另存为,编码选ansi,这时有一个重要的提示,如下图

如果没有出现上图,那说明你的情况不属于此类,下边的操作你可以不用看了.
3.重新选编码Unicode,保存.
4.帖你刚才保存的txt文件及你发到你网站上出错网页地址,方便我们查看具体出问题的地方.其它的问题由我们来处理.

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-7-19 14:22:25 | 显示全部楼层
我采集的是UTF-8,发布的是GBK,有些字符是不兼容的,理论上编码是经过火车头转换过的,应该有办法可以解决的^_^

希望可以直接解决这个问题就好啦
 楼主| 发表于 2009-7-19 14:53:44 | 显示全部楼层
事实上并没有进行编码,因为你不可能,比如将日文编码成中文.
发表于 2009-7-20 15:17:02 | 显示全部楼层
高深!!!!
希望新版智能化解决!
发表于 2009-7-21 15:48:34 | 显示全部楼层
1.在网页上右键,查看源代码.将出现源码的文本.
2.选另存为,编码选ansi,这时有一个重要的提示,如下图
如果没有出现上图,那说明你的情况不属于此类,下边的操作你可以不用看了.
3.重新选编码Unicode,保存.
4.帖你刚才保存的txt文件及你发到你网站上出错网页地址,方便我们查看具体出问题的地方.其它的问题由我们来处理.

按照斑竹的方法:

网页上右键,查看源代码.将出现源码的文本.选另存为,编码选ansi,         这时问题来了

系统没有提示就完成另存为

但发布内容依然是空格变问号!!!!!!!!!!!!!问题很严重
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-30 00:50

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表