火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2709|回复: 6

采集回来的源码里有乱码怎么屏蔽

[复制链接]
发表于 2009-4-7 20:53:36 | 显示全部楼层 |阅读模式
本帖最后由 alsyat 于 2009-4-7 22:51 编辑

问题解决了,可以采集到多张图了,但是新的问题又来了。我所采集的页面居然多处有乱码所以导致了图片在我站里发布的时候显示不出来。
现在我手动在内容排除里写入这些乱码,实在太累了,哪位老大有办法帮忙,谢谢下图就是乱码的,该怎么处理才能自动就全清除了,因为采集的页面太多如果逐一去清除,我还不如自己手动发布了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-4-7 21:18:44 | 显示全部楼层
查看数据库里的内容是否正常
 楼主| 发表于 2009-4-7 22:51:33 | 显示全部楼层
希望哪位老大 看到了 帮个忙
发表于 2009-4-7 23:30:56 | 显示全部楼层
中文出现“乱码”应该是编码的问题 ,默认的自动识别编码,你自己指定采集站点的编码就不会出现这个“乱码”了。
修改位置:编辑任务→文件保存及部分高级设置→高级设置
 楼主| 发表于 2009-4-7 23:49:09 | 显示全部楼层
编码我也试了啊 常用的我都测试了,还是不行,我采集的站 页面其他的都显示中文,唯独图片中间夹的字是乱码,我该怎么才能查到他站使用的是什么编码呢?老大
发表于 2009-4-11 12:30:34 | 显示全部楼层
看你的情况应该不是乱码
而是采集干扰文字
看下你的采集规则
吧标签过滤
最好是把采集结果发来看看
发表于 2009-4-11 12:31:39 | 显示全部楼层
过滤<span style------------------</span>
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-16 01:01

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表