OCR一般分为两种:

1,根据给定的字符特征集合,提取未知字符的特征进行匹配识别;(典型例子:GOCR)

2,不知道字符特征,但给出提取特征的规则,通过机器学习training来获取某个字符集的特征集,对未知字符进行匹配识别。;(典型例子:tesseract)

第一种方法简单,在某些场合很高效,但比较局限,字符集不能太大,比如汉字,不可能每个字符都去人工的找特征,只能是用在字符集较小的情况。第二种方法比较通用,可以应用于任何字符集,但是在前期训练的过程中必须人工教导,后期识别过程与第一种方法类似。

tips:网站验证码可以随机的或正或反或倾斜的字符,现在的OCR都没有考虑对付这种情况,因此maybe是种对付roberts的好方法,当然,英文字符有些字符不能倒,比如U,倒过来就变成n了。所以,最好是汉字吧。活动下脊椎,哈哈。那啥,版权所有,附上本页链接即可随便传用。

最新文章

  1. Android启动icon切图大小
  2. elk系列2之multiline模块的使用
  3. Daily Scrum 11.5
  4. 打印datagridview内容 实现横向纵向分页(转)
  5. 【系统移植】JNI
  6. REST Security with JWT using Java and Spring Security
  7. 学习LCMapString和LCMapStringEx
  8. ORACLE告警日志
  9. java 数字前自动补零实现
  10. 关于Windows azure从github上部署项目
  11. 安装你自己的perl modules
  12. overflow使用說明
  13. express紧急回顾随笔
  14. 细说Cookie--转
  15. Java内存的 静态方法和实例方法的区别及使用场景
  16. Listener随笔
  17. HTML5事件
  18. 最全的MonkeyRunner自动化测试从入门到精通(7)
  19. Dart语言特性必备了解!
  20. 删除(unfork)github中某个库(repository)

热门文章

  1. 使用unity3d开发app
  2. mahout运行测试与数据挖掘算法之聚类分析(一)kmeans算法解析
  3. centos7安装ifconfig命令
  4. android 开机自启动的几种方法,监听不到RECEIVE_BOOT_COMPLETED的处理办法
  5. iOS 之UIBezierPath
  6. Phalcon 訪问控制列表 ACL(Access Control Lists ACL)
  7. NodeJS on Nginx: 使用nginx反向代理处理静态页面
  8. velcoity使用说明:foreach指令
  9. 千万级大数据的Mysql数据库SQL语句优化
  10. GoogLeNet模型的微调