如何进行图文识别?

  百度api收费的,自己训练模型集费时费力,有没有训练好的库,我们拿过来直接用的呢?

  有,那就是tesseract。

安装

  pipenv install pytesseract

  pipenv install pillow

  官方下载tesseract-OCR,http://www.softpedia.com/get/Programming/Other-Programming-Files/Tesseract-OCR.shtml,安装的时候记得在语言那里勾选中文即可。

使用

  

import pytesseract
from PIL import Image def recognize(img: str, lang: str = 'chi_sim'):
"""
lang: 'eng', 'chi_sim'
"""
img = Image.open(img)
s = pytesseract.image_to_string(img, lang=lang)
print(s) recognize('img.png')

最新文章

  1. 【原】聊一聊 url 编码问题
  2. tomcat 设置jvm内存
  3. 杭电acm 1001
  4. 圣诞礼物:分享几套漂亮的圣诞节 PSD 素材
  5. Win10主题打不开,自动弹出桌面图标设置
  6. HRESULT 0x80131515 解决方法
  7. dojo 学习笔记之dojo.query - query(id) 与query(class)的差别
  8. dataList中实现用复选框一次删除多行问题
  9. c++文件编译的一些说明
  10. 『HTMl5』学习日志
  11. Nginx做文件下载服务器
  12. CUDNN安装
  13. hive-数据模型
  14. Java网络编程之查找Internet地址
  15. Objective-c官方文档 怎么自定义类
  16. PYQT5实现 关闭 提示弹框
  17. Gulp命令自动生成精灵图
  18. cocos2dx场景切换的坑
  19. java面试题----IO流种类及接口方法
  20. 由一个hash字符串生成多个子hash字符串

热门文章

  1. 1.1 大数据简介-hadoop-最全最完整的保姆级的java大数据学习资料
  2. Golang反射修改变量值
  3. 从Qt到C#,通过COM组件达成跨语言跨平台链接,或者说从托管到非托管的思路
  4. pytest.ini配置文件格式
  5. Go语言使用场景 | go语言与其它开源语言比较 | Go WEB框架选型
  6. uniapp(vue)实现点击左侧菜单,右侧显示对应的内容
  7. (已转)Linux基础第七章 线程
  8. Java基础之常用类(String类)
  9. [OpenCV实战]44 使用OpenCV进行图像超分放大
  10. 杂项 NOI2020 打铁记