发新话题
打印

[3.2版] 采集UTF-8编码网页后要保存为本地文件,但好像仅支持ascii的本地文件输出?

采集UTF-8编码网页后要保存为本地文件,但好像仅支持ascii的本地文件输出?

我在采集一个韩国的网页,测试的时候选了UTF-8来源,看效果还是蛮好的。但当选择发布方式为本地文件时,无论是HTML还是TXT,采下来的韩文都会变成问号。使用Hex编辑器查看,发现这些问号都是真正的ascii问号,而且文件头也不是utf-8的标准0xef 0xbb 0xbf。这应该是程序发送到.txt文件时的编码问题吧,与记事本中输入韩文并选择ascii保存后的现象一样。
希望在下一版补丁发布时加入这一简单修正

TOP

我也遇到同样问题,采集德文等一些UTF-8编码网页,本地发布为HTML、TXT、csv,都有次问题,显示?。如何解决?

TOP

本机安装对应的语言包试下看
小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com小孩:http://www.xxhai.com

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.172537 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-3 01:52 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档