关于OCR,一些想法
2024-08-27 15:11:49
OCR一般分为两种:
1,根据给定的字符特征集合,提取未知字符的特征进行匹配识别;(典型例子:GOCR)
2,不知道字符特征,但给出提取特征的规则,通过机器学习training来获取某个字符集的特征集,对未知字符进行匹配识别。;(典型例子:tesseract)
第一种方法简单,在某些场合很高效,但比较局限,字符集不能太大,比如汉字,不可能每个字符都去人工的找特征,只能是用在字符集较小的情况。第二种方法比较通用,可以应用于任何字符集,但是在前期训练的过程中必须人工教导,后期识别过程与第一种方法类似。
tips:网站验证码可以随机的或正或反或倾斜的字符,现在的OCR都没有考虑对付这种情况,因此maybe是种对付roberts的好方法,当然,英文字符有些字符不能倒,比如U,倒过来就变成n了。所以,最好是汉字吧。活动下脊椎,哈哈。那啥,版权所有,附上本页链接即可随便传用。
最新文章
- Android启动icon切图大小
- elk系列2之multiline模块的使用
- Daily Scrum 11.5
- 打印datagridview内容 实现横向纵向分页(转)
- 【系统移植】JNI
- REST Security with JWT using Java and Spring Security
- 学习LCMapString和LCMapStringEx
- ORACLE告警日志
- java 数字前自动补零实现
- 关于Windows azure从github上部署项目
- 安装你自己的perl modules
- overflow使用說明
- express紧急回顾随笔
- 细说Cookie--转
- Java内存的 静态方法和实例方法的区别及使用场景
- Listener随笔
- HTML5事件
- 最全的MonkeyRunner自动化测试从入门到精通(7)
- Dart语言特性必备了解!
- 删除(unfork)github中某个库(repository)
热门文章
- 使用unity3d开发app
- mahout运行测试与数据挖掘算法之聚类分析(一)kmeans算法解析
- centos7安装ifconfig命令
- android 开机自启动的几种方法,监听不到RECEIVE_BOOT_COMPLETED的处理办法
- iOS 之UIBezierPath
- Phalcon 訪问控制列表 ACL(Access Control Lists ACL)
- NodeJS on Nginx: 使用nginx反向代理处理静态页面
- velcoity使用说明:foreach指令
- 千万级大数据的Mysql数据库SQL语句优化
- GoogLeNet模型的微调