火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6879|回复: 7

火车头内容中字符&的问题

[复制链接]
发表于 2008-6-15 09:04:21 | 显示全部楼层 |阅读模式
当站点的源文件中有中文符号时,例如中文符号“。在源文件显示为& ldquo;(中间的空格去掉,要不在论坛那里会变成符号“)这样的。下到来ACCESS数据库也是这样。但通过WEB发布模式发布上去的时候,可能由于一些CMS对特殊字符的转义问题,老是把&转为成%26.因此很多文章生成之后就变成%26ldquo;
由于很多人都是采用中文符号的,所以这些转义符转在的机率很大。所以希望火车头能在WEB发布时能解决这个&的转义符问题。毕竟每个规则都要做很多转义符做替换是比较麻烦的。

[ 本帖最后由 mindong 于 2008-6-15 09:05 编辑 ]
发表于 2008-6-17 02:16:05 | 显示全部楼层
我说怎么回事 原来是这么回事

谢谢你 。。。。大哥 高啊 困扰我N久的问题。。。

我就奇怪了,采集的时候没有 百分号以后的东东

怎么一发布就出来那些乱七八糟的东西,还过滤不掉。。。晕的一塌糊涂。。
发表于 2008-8-28 06:38:56 | 显示全部楼层

以下是我遇到的一些特殊字符

content=replace(content,"”","'")
content=replace(content,"%26mdash;","-")
content=replace(content,"%26hellip;%26hellip;","。")
content=replace(content,"%26amp;"," ")
content=replace(content,"%26middot;"," ")
content=replace(content,"%26quot;","'")
content=replace(content,"%26bull;","-")
content=replace(content,"%26times;","×")
content=replace(content,"%26times;","×")
content=replace(content,"%26trade;"," ")
content=replace(content,"%26#61548;"," ")
content=replace(content,"%26eacute;","é")
content=replace(content,"%26#9642;","-")
content=replace(content,"%26iacute;","í")
可能还会很多,希望大家提出来。
发表于 2008-9-2 16:59:32 | 显示全部楼层
过滤 &(*);
搞定!....
发表于 2008-9-2 19:20:22 | 显示全部楼层
这个问题目前来说比较多用的解决办法就是替换,只要看到有的就直接全部替换
发表于 2008-9-2 19:22:23 | 显示全部楼层
原帖由 pagedown231 于 2008-9-2 16:59 发表
过滤 &(*);
搞定!....

兄弟,你这个的话是很快,但有一个问题就是到时候会没有标点符号之类的,这样的话读起文章来会很累的
发表于 2009-2-17 11:39:56 | 显示全部楼层
这些叫什么字符啊 3# packweb
发表于 2016-2-9 11:34:13 | 显示全部楼层
爪,以后学习下。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 18:49

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表