采集的内容为UTF,发布没问题,但是标题不能显示中文
http://www.serverchina.net/bbs/thread-676-1-1.html采集的内容为UTF,发布没问题,但是标题不能显示中文
求解。。。。 【标题】: SAS HBA驱动器和LSI 1064驱动程序(SUSE 10)
注意这个标题,这个标题的代码模式。
【标题】: SAS HBA驱动器和LSI 1064驱动程序(SUSE 10)
[ 本帖最后由 lctlover 于 2008-11-17 15:01 编辑 ] ServeRAID--7e - IBM服务器驱动下载 - IBM服务器 -中国服务器网论坛 服务器经销商社区 - Powered by Discuz!这个楼主给出的地址 标题代码
采集应该从<title>到</title>
过滤掉 - (*)Discuz!
注意 - 前后各一个空格位置,此标题规则,应该全站通用 :lol :lol
http://www-900.ibm.com/cn/support/tscdoc/html/FROG-6779VS.HTML
这个是采集的源文件,而我给的那网站是发布后的结果。现在就是标题的问题
现在的问题是采集出来的标题是UTF-8的模式,如果这个时候把UTF-8的标题转过去,就只能认到英文的,中文的无法显示
[ 本帖最后由 lctlover 于 2008-11-17 16:18 编辑 ] 打开之后看前十行代码就知道了。 又看了一下源文件没有使用嵌套 但是没有一个汉字。。。全部都是数字和英文。。。
这个是用的什么编码,我也不知道,
因为不是像楼主所说是 urf-8不信你用 theworld 试试用什么编码都可以显示。。。奇怪了。。。第一次看到这样的。。。 11.unicode编码的网页如何采集啊?采下来是乱码,有没有解决办法?
答:随便打开一个任务,戴上眼镜,或是睁大眼睛,看上一分钟(最多),OK,解决了。。
ali17ls 标题不支持啊。内容到是没问题了~!!!!
页:
[1]