问题:使用pytesseract库识别图片中文字时出现报错

代码:

import pytesseract
from PIL import Image,ImageEnhance
img=Image.open(r'F:\Test\venv\vfi_code.png') #修改图片的灰度,提高识别准确性
img=img.convert('RGB')
enhancer=ImageEnhance.Color(img)
enhancer=enhancer.enhance(0)
enhancer=ImageEnhance.Brightness(enhancer)
enhancer=enhancer.enhance(2)
enhancer=ImageEnhance.Contrast(enhancer)
enhancer=enhancer.enhance(8)
enhancer=ImageEnhance.Sharpness(enhancer)
img=enhancer.enhance(20) code=pytesseract.image_to_string(img,lang='chi_sim')
print(code)

原因:在安装pytesseract库后还需要安装Tesseract-OCR才能正常使用

解决办法:

1)先下载对应版本的Tesseract-OCR并安装,安装时记得把语言包都勾上。下载链接:Index of /tesseract

没有勾选语言包会有这个报错:

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file C:\\Program Files\\Tesseract-OCR/tessdata/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

2)将安装路径C:\Program Files\Tesseract-OCR 添加到系统环境变量Path里;再增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中;

3)打开终端,输入:tesseract -v,可以看到版本信息

4)在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = 'tesseract',修改成            tesseract_cmd =r'C:\Program Files\Tesseract-OCR\tesseract.exe'

5)再运行脚本就没有报错了

参考链接:https://www.jianshu.com/p/93ab58dea50f

最新文章

  1. Shell脚本快速入门
  2. java 泛型思考
  3. spfa的SLF优化
  4. Android真机测试 INSTALL_FAILED_INSUFFICIENT_STORAGE 解决方法[转]
  5. ubuntu下phpstorm无法输入中文的解决办法
  6. 迷途指针 new delete
  7. 那些常用的eclipse快捷键
  8. qt实现类似QQ伸缩窗口--鼠标事件应用
  9. Linux下获取线程TID的方法——gettid()
  10. 15个最受欢迎的Python开源框架
  11. 微信小程序开发系列(一)小程序开发初体验
  12. 使用一个for循环将N*N的二维数组的所有值置1
  13. Centos6.7的在虚拟机virulBox下的lamp平台的搭建
  14. Codeforces 2B. The least round way
  15. HDFS JournalNode 故障
  16. 分布式高并发下Actor模型
  17. XML解析技术简介——(一)
  18. ubuntu下java8卸载
  19. jQueryPrint 的简单使用
  20. 谷歌、亚马逊相继宣布屏蔽 Flash 广告,又一个时代行将结束?【转载+整理】

热门文章

  1. 原生django怎么给响应头添加信息
  2. 性能测试-性能分析思路以及CPU
  3. Ubuntu20.04修改环境变量失误导致开机循环——解决方法以及保存profile
  4. JAVA学习笔记-07
  5. MySql索引底层原理(01)
  6. mybatis-plus逻辑删除deleted
  7. 【情景题】NPDP经典题目(下)
  8. YOLO v6:一个硬件友好的目标检测算法
  9. PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像|附代码数据
  10. 扩linux 主分区 xfs 格式的