火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 14796|回复: 23

ocr 识别文件的制作 和调用 讲解

[复制链接]
发表于 2012-5-16 09:07:00 | 显示全部楼层 |阅读模式
本帖最后由 kuhabe 于 2012-5-16 09:29 编辑

1.        以制作赶集网的 图片手机号码 转换文字 为例
赶集网页网址http://bj.ganji.com/fang1/249922543x.htm
手机号码图片网址 http://bj.ganji.com/tel/52650234566157315535536b513f006051650f3e5231_4.png

2.        打开ocr识别工具


3.   如图配置


保存配置后 会生成一个 .ocr 识别文件。
注:OCR图像识别配置管理工具的说明http://v7.help.locoy.com/Platform/Module/OcrManager.htm[url]http://v7.help.locoy.com/Platform/Module/OcrManager.htm

4.标签里调用这个 .ocr识别文件



也不难的吧  O(∩_∩)O哈哈~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2012-5-18 22:01:39 | 显示全部楼层
谢谢 支持支持
发表于 2012-5-19 10:22:03 | 显示全部楼层
识别不准确啊,遇到连在一起的字就错了,赶集 58都连在一起了,希望官方能给出一个验证90%以上的ocr配置
发表于 2012-5-20 16:08:24 | 显示全部楼层
楼上说的是真的吗?识别不给力吗?
发表于 2012-5-22 06:34:00 | 显示全部楼层
识别不太给力。
原文字是
15311550360
每次识别的都不一样。
15311553313
5311533360等等。

对于黏连文字还是很有压力。



发表于 2012-5-24 11:51:15 | 显示全部楼层
学习了,观光浏览中
发表于 2012-6-2 21:18:26 | 显示全部楼层
还需要进一步完善。。好像符号就识别不了。。比如“---”
发表于 2012-6-29 21:43:51 | 显示全部楼层
中文 是不是跟不用说。
发表于 2012-7-6 09:22:15 | 显示全部楼层
打酱油的路过,顺便支持下。。。
发表于 2012-7-17 09:37:11 | 显示全部楼层
我是这样操作的,:预处理那里只选灰度处理,,达到99%的识别率,,,哈哈,相当满意了.
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-22 11:36

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表