前言

现在的手机已经可以实现拍照转文字了。作为一名程序员,得使用java代码实现这一功能,虽然可能没啥用!!!

pom.xml

添加依赖

<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>3.2.1</version>
</dependency>

这个依赖有点东西啊,32M。

test.java

     public static void main(String[] args) {
System.out.println("---------------------start--------------------------");
Tesseract tesseract = new Tesseract();
tesseract.setDatapath("D://DataScience//tessdata");
// tesseract.setLanguage("chi_sim");
try {
System.out.println(tesseract.doOCR(new File("C:\\Users\\caofei\\Desktop\\2.png")));
} catch (TesseractException e) {
e.printStackTrace();
} System.out.println("----------------------end---------------------------");
}

1.第三行,实例化一个Tesseract对象。

2.第四行,我们要实现这一功能,得需要光学字符识别工具,就像硬件设备一样(但不是真的设备,就是模型设置数据),我们要提供路径。

我下载了两个文件,eng前缀的代表英文的,chi_sim代表简体中文的。每一种语言对应一个。这些模型数据的下载地址

是:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files

里面什么语言都有,也有这项技术的简介。

3.第七号,我准备的图片2.png

执行这个main方法,控制台就会输入我们想要的内容

4.第五号我注掉了,这个工具的默认语言是英文。

如果我们想转其他语言的图片,就需要像第五行这样指定。语言不匹配,会出现乱码。

最新文章

  1. javascript 杂记
  2. 在VBA中使用Windows API
  3. UOJ 做题记录
  4. ASP.NET MVC Html.Partial/Html.RenderPartial/Html.Action/Html.RenderAction区别
  5. 简单的python服务器程序
  6. PUSHA/PUSHAD
  7. Java中的HashTable详解
  8. Printing Array elements with Comma delimiters
  9. Codeforces 482 - Diverse Permutation 构造题
  10. 安装Keras
  11. CSRF 漏洞测试
  12. 011_Python中单线程、多线程和多进程的效率对比实验
  13. 第十三节:Lambda、linq、SQL的相爱相杀(2)
  14. EF Core Migration
  15. Saiku关于MDX过滤的使用(九)
  16. CRM 数据查重
  17. Scala类的构造器与访问器
  18. “reliable message”事件引发的思考
  19. Zookeeper的基本操作
  20. Roundcube login via PHP script

热门文章

  1. PHP-生产随机验证码图片
  2. Django中三种方式写form表单
  3. 定位上下文(补充css的position属性)
  4. python设计模式-命令模式
  5. Jmeter配置联机负载生成密钥失败的问题解决
  6. openstack思维导图
  7. unity2d教程
  8. 【ABAP系列】SAP ABAP 为表维护生成器创建事务代码
  9. 【18.065】Lecture2
  10. Unity3D热更新之LuaFramework篇[05]--Lua脚本调用c#以及如何在Lua中使用Dotween