张杭烽 发表于 2009-7-18 22:42:28

谁知道如何采集GBK编码的网站?

我采用火车头,设计了采集规则,在采集页面测试内效果非常好!

采集网站:http://www.cncn.com/photo/151930/

采集内容:图片标题和图片

结果:图片都采回来很好,但是图片的标题采回来却是乱码!要命




我已经在“编辑站点”->“整站内容规则”->“选择来源站编码”->×××××(好几个GB开头的编码我都试过了,都没效果)


谁有好办法啊!先谢谢了

孤魂 发表于 2009-7-18 22:57:14

选择了GBK编码就不应该有问题了,可以选择GB2312

张杭烽 发表于 2009-7-20 18:33:49

GB开头的都选过了,貌似没效果

张杭烽 发表于 2009-7-20 18:42:11

感谢狂风的解答!!


已经正常了!!


问题在于:我原本修改编码是在“站点”管理里面修改的!!只要到任务第四步“高级设置”->手工指定编码,就可以调整了!!

{:4_193:}
页: [1]
查看完整版本: 谁知道如何采集GBK编码的网站?