xenapior 发表于 2008-6-21 12:37:38

采集UTF-8编码网页后要保存为本地文件,但好像仅支持ascii的本地文件输出?

我在采集一个韩国的网页,测试的时候选了UTF-8来源,看效果还是蛮好的。但当选择发布方式为本地文件时,无论是HTML还是TXT,采下来的韩文都会变成问号。使用Hex编辑器查看,发现这些问号都是真正的ascii问号,而且文件头也不是utf-8的标准0xef 0xbb 0xbf。这应该是程序发送到.txt文件时的编码问题吧,与记事本中输入韩文并选择ascii保存后的现象一样。
希望在下一版补丁发布时加入这一简单修正:hug:

caxlo 发表于 2008-7-24 10:30:50

我也遇到同样问题,采集德文等一些UTF-8编码网页,本地发布为HTML、TXT、csv,都有次问题,显示?。如何解决?

yjlrwmqj 发表于 2008-7-24 11:01:25

本机安装对应的语言包试下看
页: [1]
查看完整版本: 采集UTF-8编码网页后要保存为本地文件,但好像仅支持ascii的本地文件输出?