韩文网站Gmarket采集
本帖最后由 airpzk 于 2012-3-26 10:45 编辑我用的是2012版正在采集韩文网站view-source:www.gmarket.co.kr
以http://www.gmarket.co.kr/book/BookIsbn.asp?st_code=28000000606891#goodsReview为例
我再给Windows/Fonts导入韩文字体之后
用浏览器中的查看器 可以看到源代码中的文本内容 都是显示正常的韩文
但是火车采集器采集到的信息 都是用中文替代的乱码
我用火车内置的Html请求工具查看源码 韩文部分也是乱码 英文部分正常
求帮助,实在是想不出办法了
源码开头是
<html lang="ko-KR">
<head>
<title>
帖子贴不了韩文 显示有不良信息{:soso_e109:} 求能人看看 谢谢 :lol我天天采集韩文 站。。。
你这个测试过了。。。。你把 第一步里的网站编码设置成 euc-kr就可以了 。。~~
页:
[1]