URL地址编码转换问题。
本帖最后由 laolun 于 2009-6-21 21:08 编辑部分源代码如下:
<tr>
<td><p><img src="../img/chanpin/yangan/DSCF3573%20&# 25335;&# 36125;.jpg" width="485" height="386">
</p>
<p><span class="style3">T:158mm B:158mm H:50mm Nw:1251g Qty:12pcs/carton </span></p></td>
</tr>
我要采集的是img标签内容。可是在src属性里面出现了utf8编码的汉字代码(红色字体标识),我想下载这张图片,这样直接导致地址中出现&# 25335;&# 36125;而无法访问,实际地址应该是**/img/chanpin/yangan/DSCF3573%20拷贝.jpg。所以该如何让采集的img标签自动转变成/img/chanpin/yangan/DSCF3573%20拷贝.jpg呢?不然下载不了图片哦!
希望高人指点! 谁知道啊??? 没人知道?我知道了。。。 要GBK编码才行,可惜火车里面没有GBK编码。还好该论坛采用的是GBK编码,俺把那些乱七八糟的玩意以代码的形式粘贴发表后就得到了汉字,呵呵,问题解决!! {:3_155:}
页:
[1]