火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2798|回复: 5

如何采用调用数据

[复制链接]
发表于 2009-3-22 08:18:46 | 显示全部楼层 |阅读模式
我想采集这页面上的标题http://www.zuoche.com/gzzc/search_result.jsp?ti=1&sid=4465160_82e63e95&did=4591078_72b97c8b&s=%u91D1%u6CFD%u5927%u53A6&d=%u767E%u5F81%u79D1%u6280%u5927%u53A6&m=1&seq=0&stgy=0

标题代码:
<title>广州公交查询-由%u91D1%u6CFD%u5927%u53A6到%u767E%u5F81%u79D1%u6280%u5927%u53A6的乘车路线</title>
这它这里的标题是采用调用显示的,如何让他显示成正常的:广州公交查询-由金泽大厦到百征科技大厦的乘车路线
发表于 2009-3-22 08:22:54 | 显示全部楼层
http://www.zuoche.com/gzzc/searc ... mp;seq=0&stgy=0

这个页面的标题好像就可以直接获取哦
 楼主| 发表于 2009-3-22 08:42:08 | 显示全部楼层
不行呢,直接用IE打开,然后查看源代码是可以看到标题为:广州公交查询-由金泽大厦到百征科技大厦的乘车路线
但是采集器那采集就会变成:广州公交查询-由%u91D1%u6CFD%u5927%u53A6到%u767E%u5F81%u79D1%u6280%u5927%u53A6的乘车路线
发表于 2009-3-22 08:54:55 | 显示全部楼层
3# kv878

看图

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2009-3-22 10:29:51 | 显示全部楼层
3# kv878

看图
10882
飛越無限 发表于 2009-3-22 08:54





------------------------
用IE打开是可以看到,但是放到采集器那就不能采了
发表于 2009-3-22 11:55:34 | 显示全部楼层
这个是用的js的escape() 编码.如果你用的是标准版,可以使用如下的解密函数.
  1. function unescape($str) {
  2.          $str = rawurldecode($str);
  3.          preg_match_all("/%u.{4}|&#x.{4};|&#d+;|.+/U",$str,$r);
  4.          $ar = $r[0];
  5.          foreach($ar as $k=>$v) {
  6.                   if(substr($v,0,2) == "%u")
  7.                            $ar[$k] = iconv("UCS-2","GBK",pack("H4",substr($v,-4)));
  8.                   elseif(substr($v,0,3) == "&#x")
  9.                            $ar[$k] = iconv("UCS-2","GBK",pack("H4",substr($v,3,-1)));
  10.                   elseif(substr($v,0,2) == "&#") {
  11.                            $ar[$k] = iconv("UCS-2","GBK",pack("n",substr($v,2,-1)));
  12.                   }
  13.          }
  14.          return join("",$ar);
  15. }
复制代码
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-16 00:33

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表