火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3494|回复: 4

刚才谁问采集到的\u5357\u4EAC\u5E02如何处理

[复制链接]
发表于 2009-3-6 22:58:05 | 显示全部楼层 |阅读模式
  1. <?php
  2. $str = '\u5357\u4EAC\u5E02';

  3. //转换单一字符到GBK汉字
  4. function ucs2chr_to_gbkchr($chr)
  5. {
  6. if(preg_match("/^%u([0-9a-f]{4})$/i",$chr,$match))
  7. {
  8.   $unicode = $match[1];
  9.   $hex_unicode = hexdec($unicode);
  10.   $hz_string = pack('n',$hex_unicode);
  11.   $chr = iconv('UCS-2','GBK',$hz_string);
  12. }
  13. return $chr;
  14. }

  15. //转换UCS2字符串到GBK字符串

  16. function htmlucs2_to_gbk($string)
  17. {
  18. if(preg_match_all("/%u([0-9a-f]{4})/i",$string,$match))
  19. {
  20.   $replace = array ();
  21.   foreach($match[0] as $item)
  22.   {
  23.    $replace[] = ucs2chr_to_gbkchr ($item);
  24.   }
  25.   $string = str_replace($match[0],$replace,$string);
  26. }
  27. return $string;
  28. }
  29. echo htmlucs2_to_gbk(str_replace('\\', '%', $str));

  30. ?>
复制代码
发表于 2009-3-6 23:16:06 | 显示全部楼层
记号。
发表于 2009-3-7 10:28:29 | 显示全部楼层
牛B
发表于 2009-3-7 11:13:18 | 显示全部楼层
2009里支持解码这种html实体字符

System/Config.ini
搜索
HtmlDecode=False改为True
发表于 2009-3-7 14:18:36 | 显示全部楼层
2009里支持解码这种html实体字符

System/Config.ini
搜索
HtmlDecode=False改为True
火车头 发表于 2009-3-7 11:13

试了一下 行不通 照样是代码
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-11 12:59

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表