网页头部信息问题导致采集不能判断语言
采集一个国外的站,使用ie浏览器,里面的部分信息,会显示中文但是,使用火车头采集时候,中文部分的内容,又变成了英文
请问,像这种情况,要怎么处理啊 ,虽说用 自带的查看源码改头部信息可以实现
可是采集的时候,死活是英文
有没有高手知道,这种情况要怎么处理啊 在网址采集设置处有编码设置。 不是编码的问题,是语言的问题 Accept-Language: zh-cn,zh;q=0.5,好像跟这个有关系 如果是用浏览器直接访问,好像能识别出来你是中国地区,显示的是中文,而采集的时候,却变成了英文 Accept-Language: zh-cn,zh;q=0.5,
在系统设置 HTTP设置那可以填的~~~
页:
[1]