wdkey 发表于 2009-5-13 14:31:06

采集内容乱码

是采集新浪 视 频 时列表采集一切正常,在内容页采集时,标题和内容为乱码,无法匹配,但地址能采集到,后来变通了一下,在列表页把标题采到了,但内容介绍实在没办法总是乱码。
查看页面编码也全是GB2312没见有什么异常。
有类似经验的大侠们交流一下。

rq204 发表于 2009-5-13 14:38:45

你在高级设置里设置一下编码,默认是自动识别的

wdkey 发表于 2009-5-13 14:45:23

谢谢指点,手动指定成GB2312,已经正常采集了。
高级设置在最后一个选项,一直没注意。
页: [1]
查看完整版本: 采集内容乱码