python 验证码识别示例(四) 简单验证码识别
2024-10-20 05:34:07
今天介绍一个简单验证的识别。
主要是标准的格式,没有扭曲和变现。就用 pytesseract 去识别一下。
验证码地址:http://wsxf.mca.gov.cn/zfp/Random.cmd?d=1565452532947
需要识别的验证码是:
识别结果是:
识别率百分之八十。10个有两个错误。
识别代码:
#coding:utf-8
from common.contest import *
from PIL import Image
import pytesseract def recognize_captcha(img_path):
im = Image.open(img_path)
tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
num = pytesseract.image_to_string(im,config=tessdata_dir_config)
return num if __name__ == '__main__':
for i in range(1, 11):
img_path = "4/" + str(i) + ".jpg"
res = recognize_captcha(img_path)
strs = res.split("\n")
print strs[0].replace(" ",'')
最新文章
- jdk jre jvm 三者之间关系
- 在eclipse下如何安装下载好的插件
- 华为DHCP-重要
- ReentrantLock获取锁方式解读(转)
- uoj #5. 【NOI2014】动物园 kmp
- Java 声明和访问控制(二) this关键字的访问
- pgsql自动安装shell脚本整理
- Java SE (6)之 多线程
- DateTime 格式化
- Java泛型知识点:泛型类、泛型接口和泛型方法
- MySQL密码重置(root用户)
- SimpleXML系列函数操作XML
- Unable to resolve dependency问题解决
- golang interface
- Nowcoder contest 370H Rinne Loves Dynamic Graph【分层图最短路】
- 【BZOJ1876】[SDOI2009]SuperGCD(数论,高精度)
- logmnr使用
- java多线程与并发笔记
- node-webkit学习(2)基本结构和配置
- 【高可用HA】Apache (4) —— Mac下配置Apache Httpd负载均衡(Load Balancer)之mod_jk