nwm 发表于 2010-3-30 16:50:40

火车头采集http://blog.sina.com.cn/lm/astro/index.html,乱码??

用火车头采集新浪网http://blog.sina.com.cn/lm/astro/index.html,时,当高级设置编码为GB2312时网页为乱码,当编码修改为utf-8时,文章乱码消除,但采集不到网址,同时入库的文件全是乱码!!求高手解决!!

面向大海 发表于 2010-3-30 17:26:07

获取网址列表那里的中文去掉就可以了

kagebaby 发表于 2010-4-28 16:59:50

路过,该是楼上说的问题!
页: [1]
查看完整版本: 火车头采集http://blog.sina.com.cn/lm/astro/index.html,乱码??