emmanuelgareth 发表于 2011-8-22 17:55:13

求高手指点,采集到的内容如何用正则表达式转码为utf-8?

本帖最后由 emmanuelgareth 于 2011-9-9 09:55 编辑

我用火车头采集到的内容,如何用正则表达式转码为utf-8?

就是转换为以下这种格式:%B2%C9%BC%AF%B5%BD%B5%C4%C4%DA%C8%DD%C8%E7%BA%CE%D3%C3%D5%FD%D4%F2%B1%ED%B4%EF%CA%BD%D7%AA%C2%EB%CE%AA%75%74%66%2D%38%A3%BF

火车头没有这功能? 有没有人会呀?

303718 发表于 2011-8-22 20:35:34

转utf-8是不用什么的 你采集的时候选utf-8就行了

lypying 发表于 2011-8-22 21:02:06

:%B2%C9%BC%AF%B5%BD%B5%C4%C4%DA%C8%DD%C8%E7%BA%CE%D3%C3%D5%FD%D4%F2%B1%ED%B4%EF%CA%BD%D7%AA%C2%EB%CE%AA%75%74%66%2D%38%A3%BF
这是URLENCODE编码 呵呵

emmanuelgareth 发表于 2011-8-22 22:26:51

回复 3# lypying


    请问怎么才能让它采集后自动转换为这种编码呀,在哪设呀,多谢指点!

emmanuelgareth 发表于 2011-8-22 22:28:07

回复 2# 303718

采集的时候选UTF-8,问题是哪在选呀,我怎么也找不到,请帮忙指点一下呀,多谢!

ulfhvk 发表于 2011-8-24 10:14:07

采集的时候查找网址,替换成网址的编码就行了。

303718 发表于 2011-8-24 11:04:36

回复 5# emmanuelgareth



但你这不是编码问题。你这个可以用PHP转换就行

emmanuelgareth 发表于 2011-8-26 11:35:18

回复 7# 303718

在这里改没有用吧,因为要采集的信息本身是汉字,我只是要将它采集后转码

303718 发表于 2011-8-26 12:02:40

是的。你这种在这里改是没有用的。
页: [1]
查看完整版本: 求高手指点,采集到的内容如何用正则表达式转码为utf-8?