rq204 发表于 2009-7-19 14:04:52

关于发布时出现问号的处理办法

有的朋友在采集了一些数据后,发布到自己的网站时,会发现原来一些空白字符变成了问号.例如:

http://bbs.locoy.com/viewthread.php?tid=39448&highlight=%BF%D5%B8%F1


此问题和采集器程序无关,是由于对方网页里的字符编码你的网站无法识别造成,你可以在发布时抓取数据包,程序是完整的将数据发布上去了,只是你网站的编码里无法识别,所以就显示成了?.

此问题的解决办法是采集器中直接过滤,但考虑到手工处理相对麻烦,所以新版本打算直接进行过滤.但因为导致?问号的可能不止是一个字符,所以希望大家提交自己的此类问题的网址网站,你要做的是,我们以 http://www.yeeyan.com/articles/view/lovedzc/2852 为例:

1.在网页上右键,查看源代码.将出现源码的文本.
2.选另存为,编码选ansi,这时有一个重要的提示,如下图

如果没有出现上图,那说明你的情况不属于此类,下边的操作你可以不用看了.
3.重新选编码Unicode,保存.
4.帖你刚才保存的txt文件及你发到你网站上出错网页地址,方便我们查看具体出问题的地方.其它的问题由我们来处理.

孤魂 发表于 2009-7-19 14:22:25

我采集的是UTF-8,发布的是GBK,有些字符是不兼容的,理论上编码是经过火车头转换过的,应该有办法可以解决的^_^

希望可以直接解决这个问题就好啦

rq204 发表于 2009-7-19 14:53:44

事实上并没有进行编码,因为你不可能,比如将日文编码成中文.

cshack 发表于 2009-7-20 15:17:02

高深!!!!
希望新版智能化解决!

lyp10258 发表于 2009-7-21 15:48:34

1.在网页上右键,查看源代码.将出现源码的文本.
2.选另存为,编码选ansi,这时有一个重要的提示,如下图
如果没有出现上图,那说明你的情况不属于此类,下边的操作你可以不用看了.
3.重新选编码Unicode,保存.
4.帖你刚才保存的txt文件及你发到你网站上出错网页地址,方便我们查看具体出问题的地方.其它的问题由我们来处理.

按照斑竹的方法:

网页上右键,查看源代码.将出现源码的文本.选另存为,编码选ansi,         这时问题来了

系统没有提示就完成另存为

但发布内容依然是空格变问号!!!!!!!!!!!!!问题很严重
页: [1]
查看完整版本: 关于发布时出现问号的处理办法