火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2786|回复: 3

unicode 编码的html 这么转换成中文

[复制链接]
发表于 2012-11-19 02:34:42 | 显示全部楼层 |阅读模式
<li id="J_attrBrandName" title="&nbsp;Camel/&#39558;&#39548;">品牌:&nbsp;Camel/&#39558;&#39548;</li>

                                                                                                                                                                                                <li title="&nbsp;&#22278;&#22836;">鞋头款式:&nbsp;&#22278;&#22836;</li>

                                                                                                                                                                                                <li title="&nbsp;&#31995;&#24102;">闭合方式:&nbsp;&#31995;&#24102;</li>

                                                                                                                                                                                                <li title="&nbsp;&#27233;&#33014;">鞋底材质:&nbsp;&#27233;&#33014;</li>

                                                                                                                                                                                                <li


比如采集的是上面的这种.怎么转换成可见的中文呢?
发表于 2012-11-19 08:36:41 | 显示全部楼层
现在这个就是中文呢&nbsp;只是空格
发表于 2012-11-19 12:29:12 | 显示全部楼层
有两种方式:

1. 过滤掉所有 html标签,入库的都是中文字符,但发布可能会遇到麻烦
2. 就这样直接入库,因为你发布的目标站是需要解析掉标签的。
发表于 2012-11-20 12:51:26 | 显示全部楼层
gip q不错呀你们,我都不会
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-24 06:08

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表