火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2406|回复: 2

这是啥编码??

[复制链接]
发表于 2010-9-15 21:44:23 | 显示全部楼层 |阅读模式
本帖最后由 jackyshow 于 2010-9-16 01:27 编辑

谁知道这是啥编码???

& # x 7 F 5 1 ; (网)---中间没空格,直接发布的话浏览器会直接转换 看不到
w(w)

括号里是对应的字符,其实就是51la的关键词编码,搞了半天没搞清楚什么编码。。。想抓取。。以下是插件函数,貌似不起作用

  1. function str_from_unicode($str, $out_charset = 'gbk'){
  2. $str = preg_replace_callback("|&#([0-9]{1,5});|", 'unicode2utf8_', $str);
  3. $str = iconv("UTF-8", $out_charset, $str);
  4. return $str;
  5. }
  6. function unicode2utf8_($c){
  7. return unicode2utf8($c[1]);
  8. }
  9. function unicode2utf8($c){
  10. $str="";
  11. if ($c < 0x80) {
  12. $str.=$c;
  13. } else if ($c < 0x800) {
  14. $str.=chr(0xC0 | $c>>6);
  15. $str.=chr(0x80 | $c & 0x3F);
  16. } else if ($c < 0x10000) {
  17. $str.=chr(0xE0 | $c>>12);
  18. $str.=chr(0x80 | $c>>6 & 0x3F);
  19. $str.=chr(0x80 | $c & 0x3F);
  20. } else if ($c < 0x200000) {
  21. $str.=chr(0xF0 | $c>>18);
  22. $str.=chr(0x80 | $c>>12 & 0x3F);
  23. $str.=chr(0x80 | $c>>6 & 0x3F);
  24. $str.=chr(0x80 | $c & 0x3F);
  25. }
  26. return $str;
  27. }
复制代码
 楼主| 发表于 2010-9-15 21:52:22 | 显示全部楼层
(网)的unicode编码应该是 & # 3 2 5 9 3 ;吧。。。
 楼主| 发表于 2010-9-16 01:27:33 | 显示全部楼层
已搞定,是十六进制编码格式!谢谢路过的。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-2 20:40

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表