求高招：默认页编码gb2312，但有几个采集页面是utf8，怎么办

shiyebianok · 发表于 2010-11-22 12:32:03

要采集这样一个任务，
默认页编码gb2312，但另有几个页面是utf8的，这几个页面的数据也同样重要。
可是，我试了下，utf8采集过来的都是乱码，怎么让两种编码采集过来的数据都是正常的中文呢？

shiyebianok · 发表于 2010-11-22 12:35:56

内容中的Utf8貌似用自动识别可以搞定了
可是：
这些采集页面的url地址中带很多%的怎么搞定？和gb的不一样啊

帐号		自动登录	找回密码
密码			加入会员