Python 之pytesseract模块读取知乎验证码案例
2024-08-31 02:53:43
import pytesseract
from PIL import Image
import requests
import time # 获取只会验证码图片并保存为本地
def get_data_request():
headers = {
"User-Agent": "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0"
}
captcha_url = 'https://www.zhihu.com/captcha.gif?r=%d&type=login' % (time.time() * 1000)
try:
response = requests.get(captcha_url, headers=headers)
try:
img_name = "./captcha.png"
with open(img_name, "wb") as f:
f.write(response.content)
return img_name
except IOError as e:
print(e)
except ConnectionError as e:
print(e) # 读取图片内容返回
def read_captcha(img_url):
image = Image.open(img_url)
text = pytesseract.image_to_string(image)
return text def main():
img = get_data_request()
read_data = read_captcha(img)
print(read_data) if __name__ == '__main__':
main()
结果如图:
最新文章
- windows下编译及使用libevent
- java连接Oracle数据库
- Android progressBar 自定义圆形旋转图片
- C# mvc--ORM框架中EF的作用和特点
- python-property、docstring--笔记
- mschedule 简单linux进程管理(树莓派)
- 类和对象:继承 - 零基础入门学习Python038
- Python爬虫小白入门(五)PhatomJS+Selenium第二篇
- URL 传+号到后台变空格问题解决方案
- 内核对象kobject和sysfs(1)——概述
- JSP制作简单登陆
- Java 设计模式原则
- python_判断变量类型
- Matlab绘图基础——散点生成三角网(TIN)
- 使用 NPOI 导出 Excel 文件
- ApiKernel
- 【转】java将excel文件转换成txt格式文件
- 潭州课堂25班:Ph201805201 爬虫基础 第三课 urllib (课堂笔记)
- vue教程2-07 自定义指令
- 计蒜客 31001 - Magical Girl Haze - [最短路][2018ICPC南京网络预赛L题]