lctlover 发表于 2008-11-17 14:56:44

采集的内容为UTF,发布没问题,但是标题不能显示中文

http://www.serverchina.net/bbs/thread-676-1-1.html


采集的内容为UTF,发布没问题,但是标题不能显示中文

求解。。。。

lctlover 发表于 2008-11-17 14:58:17

【标题】: SAS HBA驱动器和LSI 1064驱动程序(SUSE 10)


注意这个标题,这个标题的代码模式。

【标题】: SAS HBA驱动器和LSI 1064驱动程序(SUSE 10)

[ 本帖最后由 lctlover 于 2008-11-17 15:01 编辑 ]

xiongyujie37 发表于 2008-11-17 15:06:50

ServeRAID--7e - IBM服务器驱动下载 - IBM服务器 -中国服务器网论坛 服务器经销商社区 - Powered by Discuz!这个楼主给出的地址 标题代码


采集应该从<title>到</title>

过滤掉   - (*)Discuz!

注意 - 前后各一个空格位置,此标题规则,应该全站通用

lctlover 发表于 2008-11-17 15:39:49

:lol :lol
http://www-900.ibm.com/cn/support/tscdoc/html/FROG-6779VS.HTML

这个是采集的源文件,而我给的那网站是发布后的结果。现在就是标题的问题


现在的问题是采集出来的标题是UTF-8的模式,如果这个时候把UTF-8的标题转过去,就只能认到英文的,中文的无法显示

[ 本帖最后由 lctlover 于 2008-11-17 16:18 编辑 ]

lovebaidu 发表于 2008-11-17 16:48:56

打开之后看前十行代码就知道了。

xiongyujie37 发表于 2008-11-17 16:54:42

又看了一下源文件没有使用嵌套 但是没有一个汉字。。。全部都是数字和英文。。。

这个是用的什么编码,我也不知道,

因为不是像楼主所说是 urf-8不信你用 theworld 试试用什么编码都可以显示。。。奇怪了。。。第一次看到这样的。。。

lctlover 发表于 2008-11-17 18:58:03

11.unicode编码的网页如何采集啊?采下来是乱码,有没有解决办法?
答:随便打开一个任务,戴上眼镜,或是睁大眼睛,看上一分钟(最多),OK,解决了。。

ali17ls 标题不支持啊。内容到是没问题了~!!!!
页: [1]
查看完整版本: 采集的内容为UTF,发布没问题,但是标题不能显示中文