火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2832|回复: 6

疑难杂症,编码与发布模块的问题,请大家指点一下

[复制链接]
发表于 2009-3-25 20:32:50 | 显示全部楼层 |阅读模式
本帖最后由 itsoso 于 2009-3-25 20:34 编辑

首先这个问题比较特别,是这样的,我的E文论坛的编码是 ISO-8859-1,这样采e文发布当然没有问题,但是如果是采集中文发布,就是 一堆 ???? 问号出来,

我自己在论坛尝试手工发中文,知道发布的时候中文会转换成
& #25105; & #26412;
这种格式,但是用火车发布的时候却不行,不知道怎么弄了,在测试发布的时候勾选了 urlencode 还是出来 ???? 好多问号!

希望知道如何解决的朋友帮忙一下,十分感谢
发表于 2009-3-25 22:23:53 | 显示全部楼层
选择发布模块的编码,没有自己加进去就行了
 楼主| 发表于 2009-3-25 22:37:28 | 显示全部楼层
选择发布模块的编码,没有自己加进去就行了
alexai 发表于 2009-3-25 22:23


谢谢,不过 编码 已经选择对的,就是系统不会自动转换中文为我上面说的那种格式,所以发布出去还是 问号,但是在论坛手动发贴,论坛就能在post数据的时候转换好代码
 楼主| 发表于 2009-3-26 06:10:32 | 显示全部楼层


刚刚试着对火车 测试发布 截包,发现火车发布上面这种“中文编码的时候” ,在内容会把编码变成 “?”,但是在主题则正常,这是没有勾选 对中文进行urlencode的情况

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2009-3-26 06:22:34 | 显示全部楼层


接着我们来看看,勾选 对中文进行urlencode后的情况,发现主题的 "&"  "#"  ";" 这3个符号分别用 "%26"  " %23" " %3b" 替换了,这样就能在 iso-8859-1 的发布模块中发中文,可惜 内容标签里面 依然是把 中文编码替换成 ?,% 3 f   就是一个问号

现在对于采集这种“特殊中文编码”有了一个简单的解决方案:在采集标题和内容标签的时候分别添加 替换掉 "&"  "#"  ";" 这3个符号,然后发布到时候不要勾选 urlencode  这样就行了

可惜未想到我主题贴中的那种要怎么解决,思考中

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2009-3-26 06:28:34 | 显示全部楼层
本帖最后由 itsoso 于 2009-3-26 06:35 编辑

唉  抓包工具大家要常用
 楼主| 发表于 2009-3-28 21:28:21 | 显示全部楼层
有朋友关注一下这个问题么
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-30 07:34

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表