lzc245 发表于 2010-9-6 18:06:23

网页头部信息问题导致采集不能判断语言

采集一个国外的站,使用ie浏览器,里面的部分信息,会显示中文
但是,使用火车头采集时候,中文部分的内容,又变成了英文
请问,像这种情况,要怎么处理啊 ,虽说用 自带的查看源码改头部信息可以实现
可是采集的时候,死活是英文
有没有高手知道,这种情况要怎么处理啊

skykate 发表于 2010-9-6 19:31:24

在网址采集设置处有编码设置。

lzc245 发表于 2010-9-7 14:35:11

不是编码的问题,是语言的问题 Accept-Language: zh-cn,zh;q=0.5,好像跟这个有关系

lzc245 发表于 2010-9-7 14:35:40

如果是用浏览器直接访问,好像能识别出来你是中国地区,显示的是中文,而采集的时候,却变成了英文

火车头 发表于 2010-9-7 15:44:41

Accept-Language: zh-cn,zh;q=0.5,

在系统设置 HTTP设置那可以填的~~~
页: [1]
查看完整版本: 网页头部信息问题导致采集不能判断语言