关于发布时出现问号的处理办法
有的朋友在采集了一些数据后,发布到自己的网站时,会发现原来一些空白字符变成了问号.例如:http://bbs.locoy.com/viewthread.php?tid=39448&highlight=%BF%D5%B8%F1
此问题和采集器程序无关,是由于对方网页里的字符编码你的网站无法识别造成,你可以在发布时抓取数据包,程序是完整的将数据发布上去了,只是你网站的编码里无法识别,所以就显示成了?.
此问题的解决办法是采集器中直接过滤,但考虑到手工处理相对麻烦,所以新版本打算直接进行过滤.但因为导致?问号的可能不止是一个字符,所以希望大家提交自己的此类问题的网址网站,你要做的是,我们以 http://www.yeeyan.com/articles/view/lovedzc/2852 为例:
1.在网页上右键,查看源代码.将出现源码的文本.
2.选另存为,编码选ansi,这时有一个重要的提示,如下图
如果没有出现上图,那说明你的情况不属于此类,下边的操作你可以不用看了.
3.重新选编码Unicode,保存.
4.帖你刚才保存的txt文件及你发到你网站上出错网页地址,方便我们查看具体出问题的地方.其它的问题由我们来处理. 我采集的是UTF-8,发布的是GBK,有些字符是不兼容的,理论上编码是经过火车头转换过的,应该有办法可以解决的^_^
希望可以直接解决这个问题就好啦 事实上并没有进行编码,因为你不可能,比如将日文编码成中文. 高深!!!!
希望新版智能化解决! 1.在网页上右键,查看源代码.将出现源码的文本.
2.选另存为,编码选ansi,这时有一个重要的提示,如下图
如果没有出现上图,那说明你的情况不属于此类,下边的操作你可以不用看了.
3.重新选编码Unicode,保存.
4.帖你刚才保存的txt文件及你发到你网站上出错网页地址,方便我们查看具体出问题的地方.其它的问题由我们来处理.
按照斑竹的方法:
网页上右键,查看源代码.将出现源码的文本.选另存为,编码选ansi, 这时问题来了
系统没有提示就完成另存为
但发布内容依然是空格变问号!!!!!!!!!!!!!问题很严重
页:
[1]