有鱼工作室 发表于 2012-11-19 02:34:42

unicode 编码的html 这么转换成中文

<li id="J_attrBrandName" title="&nbsp;Camel/骆驼">品牌:&nbsp;Camel/骆驼</li>

                                                                                                                                                                                                <li title="&nbsp;圆头">鞋头款式:&nbsp;圆头</li>

                                                                                                                                                                                                <li title="&nbsp;系带">闭合方式:&nbsp;系带</li>

                                                                                                                                                                                                <li title="&nbsp;橡胶">鞋底材质:&nbsp;橡胶</li>

                                                                                                                                                                                                <li


比如采集的是上面的这种.怎么转换成可见的中文呢?

303718 发表于 2012-11-19 08:36:41

现在这个就是中文呢&nbsp;只是空格

sushy 发表于 2012-11-19 12:29:12

有两种方式:

1. 过滤掉所有 html标签,入库的都是中文字符,但发布可能会遇到麻烦
2. 就这样直接入库,因为你发布的目标站是需要解析掉标签的。

lrch110 发表于 2012-11-20 12:51:26

gip q不错呀你们,我都不会
页: [1]
查看完整版本: unicode 编码的html 这么转换成中文