airpzk 发表于 2012-3-26 10:42:03

韩文网站Gmarket采集

本帖最后由 airpzk 于 2012-3-26 10:45 编辑

我用的是2012版正在采集韩文网站view-source:www.gmarket.co.kr
以http://www.gmarket.co.kr/book/BookIsbn.asp?st_code=28000000606891#goodsReview为例
我再给Windows/Fonts导入韩文字体之后
用浏览器中的查看器 可以看到源代码中的文本内容 都是显示正常的韩文

但是火车采集器采集到的信息 都是用中文替代的乱码
我用火车内置的Html请求工具查看源码 韩文部分也是乱码 英文部分正常
求帮助,实在是想不出办法了
源码开头是
<html lang="ko-KR">
<head>
<title>
帖子贴不了韩文 显示有不良信息{:soso_e109:} 求能人看看 谢谢

honhole 发表于 2012-3-26 13:36:26

:lol我天天采集韩文 站。。。

你这个测试过了。。。。你把   第一步里的网站编码设置成   euc-kr就可以了 。。~~
页: [1]
查看完整版本: 韩文网站Gmarket采集