一,OCR  

  OCR,即Optical Character Recognition,光学字符识别,通过扫描字符,分析形状,然后将其翻译成电子文本的过程。tesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层封装。安装tesserocr之前需要先按照tesseract。

二,准备工具

  安装库tesserocr,windows下安装前需要下载安装tesseract,

  tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/

    

  图中有很多版本,其中带dev的为开发版本,不带dev的为稳定版本,推荐下载稳定版本。

    

  安装时勾选Additional language data选项来安装OCR识别支持的语言包,可以识别多国语言。然后一直点击Next即可。

  接下来,安装tesserocr即可:pip3 install tesserocr pillow

  whl安装包下载链接:https://github.com/simonflueckiger/tesserocr-windows_build/releases

  选择合适的版本下载   运行

  pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl

三、代码

import tesserocr
from PIL import Image image = Image.open('code.png')
res = tesserocr.image_to_text(image)
print(image, res)
# 二值化
image = image.convert('L')
threshold = 127
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1) image = image.point(table, '')
image.show() result = tesserocr.image_to_text(image)
print(result)

最新文章

  1. Go Data Structures: Interfaces
  2. HTTP协议学习---(三)摘要认证
  3. Java实现颜色渐变效果
  4. 关于java.lang.reflect.InvocationTargetException
  5. uiwebview和 js交互框架
  6. LeapMotion(2):追踪五指
  7. 中兴电信光纤猫F612管理员密码获取方法
  8. jquerymobile知识点:select的动态帮定
  9. 《精通CSS:高级Web标准解决方案》学习笔记(下)
  10. Farpoint Spread 常用事件
  11. VMware vSphere 服务器虚拟化之二十二桌面虚拟化之创建View Composer链接克隆的虚拟桌面池
  12. wp天气预报
  13. python paramiko基本
  14. 转 Linux下的GoldenGate的启动关闭Shell脚本(独立)
  15. Python+PyCharm的一些基本设置:安装使用、注册码、显示行号、字体大小和快捷键等常用设置
  16. andrroid 测试那点事
  17. Spring Boot程序获取tomcat启动端口
  18. Java 基础知识点
  19. IEC2017级_1-2班两次博客作业成绩说明
  20. c#基础知识之 Dataset 索引0没有值

热门文章

  1. Toolbar中系统自带返回键(setDisplayHomeAsUpEnabled)与Toolbar本身的inflateMenu冲突问题
  2. 【数据库】SQL 关系代数
  3. kube-controller-manager配置详解
  4. Win10教育版VL版kms密钥激活
  5. GBDT入门
  6. FPGA CRC-16/XMODEM x16+x12+x5+1
  7. .net APP接口
  8. Numa解释
  9. python画图嵌入html
  10. Mybatis之一级缓存(七)