使用Python基于百度等OCR API的文字识别
2024-09-03 02:10:30
百度OCR
Baidu OCR API:一定额度免费,目前是每日500次
Python SDK文档:https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html
安装使用
1)首先注册一个百度云BCE账号
登录官网https://cloud.baidu.com/ --> 右上角‘管理控制台’ --> 产品服务 --> 文字识别https://console.bce.baidu.com/ai/#/ai/ocr/overview/index --> 创建应用 --> 立即创建
2)然后从控制面板新建一个文字识别应用
查看应用列表
获得调用API需要的AppID,API Key 和 Secret Key
3)安装OCR Python SDK
pip install baidu-aip
封装和调用
接口说明:https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E6.8E.A5.E5.8F.A3.E8.AF.B4.E6.98.8E
# 新建AipOCR from aip import AipOcr config = { 'appId': 'your-id', 'apiKey': 'your-key', 'secretKey': 'your-secret-key' } client = AipOcr(**config) def get_file_content(file): with open(file, 'rb') as fp: return fp.read() def img_to_str(image_path): image = get_file_content(image_path) result = client.basicGeneral(image) if 'words_result' in result: return '\n'.join([w['words'] for w in result['words_result']]) if __name__ == '__main__' : imagepath = './image/Test.png' img_to_str(imagepath)
测试 - 识别1:
测试 - 识别2:
测试 - 识别3:
测试 - 识别4:
总结
提供多种参数 - 处理灵活 - 比如自定义旋转,返回可信度,特定类型证件识别等
其他OCR
- 微软Azure 图像识别:https://azure.microsoft.com/zh-cn/services/cognitive-services/computer-vision/
- 有道智云文字识别:http://aidemo.youdao.com/ocrdemo
- 阿里云图文识别:https://www.aliyun.com/product/cdi/
- 腾讯OCR文字识别:https://cloud.tencent.com/product/ocr
- TesseractOCR文字识别:https://digi.bib.uni-mannheim.de/tesseract/(Tesseract有提供优化版的简体中文语料库)
最新文章
- Windows 10 密钥分享
- JavaScript 10分钟入门
- Js作用域与作用域链详解[转]
- mysql删除、修改字段默认值
- Core模块其他常用知识点[OpenCV 笔记14]
- Objective-C中的@Property详解
- Unity 网络斗地主 牌的一些算法
- 文成小盆友python-num5 -装饰器回顾,模块,字符串格式化
- android入门——UI(4)
- 笔试题引出float数据的存储方式的深究
- Servlet过滤器——使用过滤器禁止浏览器缓存页面
- 10624 - Super Number
- 前端模块化之seajs
- Properties读取属性文件
- NOIP2017 总结
- Go-day05
- Stream Processing 101: From SQL to Streaming SQL in 10 Minutes
- UITabBarController 的配置
- div框选中状态,倒三角样式
- 裸函数naked解析
热门文章
- [Note][深入理解Java虚拟机] 第三章 垃圾收集器与内存分配策略笔记
- html基础(选择器,font属性 )
- [CSP-S模拟测试]:那一天她里我而去(堆优化Dijkstra)
- Python中很少见的用法
- 2018-2019-2 20165215《网络对抗技术》Exp7 网络欺诈防范
- python3笔记二十:时间操作time
- Nginx事件管理之概念描述
- centos7.2 安装nginx+php
- 六、Jmeter中自动提取Http请求参数,并put到Map,然后进行MD5加密
- PHP安装 (结合之前的nginx安装与mysql安装组合为lnmp)