axus 发表于 2010-6-3 05:16:17

火车头不能识别utf8的字符

http://www.cmda.org.cn/academic/content_c0705_x33111__.html这是要采集的内容页,utf8格式的
内容页中,【关键词】突发性耳聋
之间采集的结果必为?和一个空格,原因是前面一个utf8字符火车头不能识别,只能以?号取代。规则再怎么改都没用,软件没法识别这个utf8这个字符
页: [1]
查看完整版本: 火车头不能识别utf8的字符