yuanbao100 发表于 2013-3-27 10:18:31

采集出现乱码

火车采集器采集网站内容出现乱码,即使制定了utf-8编码,也乱码,这是涉及到下载图片时出现的问题,之前没有下载图片,能够正常采集并且不乱码,怎么解决?

303718 发表于 2013-3-28 09:11:19

你好。采集规则贴上来试试

yuanbao100 发表于 2013-3-28 16:31:56

我把任务导出放到了附件里

303718 发表于 2013-3-28 17:13:05

我试了没有乱呢。图片也正常下载了

yuanbao100 发表于 2013-3-28 19:27:33

是在发布时候出现乱码,单页面都测试过了,不会乱码,乱码是在采集页面跳转的时候,也就是从http://www.china-embassy.org/chn/zgyw/跳转到http://www.china-embassy.org/chn/zgyw/default_1.htm时,以及后面页面跳转的时候也全部乱码

303718 发表于 2013-3-28 21:59:38

没有弄明白.你是采集下来的代码就乱码还是发布出去才乱

yuanbao100 发表于 2013-3-29 09:37:25

采集下来就已经乱码了

wxl08 发表于 2013-3-29 10:14:03

采集规则设置不对,第一步没有添加采集网址规则,从列表页获取到内容的详细页

yuanbao100 发表于 2013-3-29 15:49:42

之前规则是,在第二步正则匹配获取网址,并发送Http请求采集数据,变换规则后能够成功采集,请问能否不变更之前的规则解决乱码问题?
页: [1]
查看完整版本: 采集出现乱码