火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4175|回复: 6

采集的内容为UTF,发布没问题,但是标题不能显示中文

[复制链接]
发表于 2008-11-17 14:56:44 | 显示全部楼层 |阅读模式
http://www.serverchina.net/bbs/thread-676-1-1.html


采集的内容为UTF,发布没问题,但是标题不能显示中文

求解。。。。
 楼主| 发表于 2008-11-17 14:58:17 | 显示全部楼层
【标题】: SAS HBA驱动器和LSI 1064驱动程序(SUSE 10)


注意这个标题,这个标题的代码模式。

  1. 【标题】: SAS HBA驱动器和LSI 1064驱动程序(SUSE 10)
复制代码

[ 本帖最后由 lctlover 于 2008-11-17 15:01 编辑 ]
发表于 2008-11-17 15:06:50 | 显示全部楼层
  1. ServeRAID--7e - IBM服务器驱动下载 - IBM服务器 -  中国服务器网论坛 服务器经销商社区 - Powered by Discuz!
复制代码
这个楼主给出的地址 标题代码


采集应该从  <title>到</title>  

过滤掉   - (*)Discuz!

注意 - 前后各一个空格位置,此标题规则,应该全站通用

评分

1

查看全部评分

 楼主| 发表于 2008-11-17 15:39:49 | 显示全部楼层

http://www-900.ibm.com/cn/support/tscdoc/html/FROG-6779VS.HTML

这个是采集的源文件,而我给的那网站是发布后的结果。现在就是标题的问题


现在的问题是采集出来的标题是UTF-8的模式,如果这个时候把UTF-8的标题转过去,就只能认到英文的,中文的无法显示

[ 本帖最后由 lctlover 于 2008-11-17 16:18 编辑 ]
发表于 2008-11-17 16:48:56 | 显示全部楼层
打开之后看前十行代码就知道了。
发表于 2008-11-17 16:54:42 | 显示全部楼层
又看了一下  源文件没有使用嵌套 但是没有一个汉字。。。全部都是数字和英文。。。

这个是用的什么编码,我也不知道,

因为不是像楼主所说是 urf-8  不信你用 theworld 试试  用什么编码都可以显示。。。奇怪了。。。第一次看到这样的。。。
 楼主| 发表于 2008-11-17 18:58:03 | 显示全部楼层
11.unicode编码的网页如何采集啊?采下来是乱码,有没有解决办法?
答:随便打开一个任务,戴上眼镜,或是睁大眼睛,看上一分钟(最多),OK,解决了。。

标题不支持啊。内容到是没问题了~!!!!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-4 08:54

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表