Tesseract图片文字识别
2024-09-08 17:55:25
如何进行图文识别?
百度api收费的,自己训练模型集费时费力,有没有训练好的库,我们拿过来直接用的呢?
有,那就是tesseract。
安装
pipenv install pytesseract
pipenv install pillow
官方下载tesseract-OCR,http://www.softpedia.com/get/Programming/Other-Programming-Files/Tesseract-OCR.shtml,安装的时候记得在语言那里勾选中文即可。
使用
import pytesseract
from PIL import Image def recognize(img: str, lang: str = 'chi_sim'):
"""
lang: 'eng', 'chi_sim'
"""
img = Image.open(img)
s = pytesseract.image_to_string(img, lang=lang)
print(s) recognize('img.png')
最新文章
- 【原】聊一聊 url 编码问题
- tomcat 设置jvm内存
- 杭电acm 1001
- 圣诞礼物:分享几套漂亮的圣诞节 PSD 素材
- Win10主题打不开,自动弹出桌面图标设置
- HRESULT 0x80131515 解决方法
- dojo 学习笔记之dojo.query - query(id) 与query(class)的差别
- dataList中实现用复选框一次删除多行问题
- c++文件编译的一些说明
- 『HTMl5』学习日志
- Nginx做文件下载服务器
- CUDNN安装
- hive-数据模型
- Java网络编程之查找Internet地址
- Objective-c官方文档 怎么自定义类
- PYQT5实现 关闭 提示弹框
- Gulp命令自动生成精灵图
- cocos2dx场景切换的坑
- java面试题----IO流种类及接口方法
- 由一个hash字符串生成多个子hash字符串
热门文章
- 1.1 大数据简介-hadoop-最全最完整的保姆级的java大数据学习资料
- Golang反射修改变量值
- 从Qt到C#,通过COM组件达成跨语言跨平台链接,或者说从托管到非托管的思路
- pytest.ini配置文件格式
- Go语言使用场景 | go语言与其它开源语言比较 | Go WEB框架选型
- uniapp(vue)实现点击左侧菜单,右侧显示对应的内容
- (已转)Linux基础第七章 线程
- Java基础之常用类(String类)
- [OpenCV实战]44 使用OpenCV进行图像超分放大
- 杂项 NOI2020 打铁记