http://blog.csdn.net/wsk1103/article/details/54173282

java中识别文字比较简单,使用的软件是tesseractocr(使用的版本是3.02,3以后的版本才支持中文),这个软件需要安装在本地电脑中,安装的过程中全部都按照默认进行安装(以便于Java直接调用),

下载地址http://download.csdn.net/detail/wsk1103/9731338

该软件默认的识别的是英文,如果相要能识别中文,需要将中文的训练文本chi_sim.traineddata存放到C:\Program Files (x86)\Tesseract-OCR\tessdata中,其中该中文训练文本解压后39M左右,

下载地址http://download.csdn.net/detail/wsk1103/9731335

,遗憾的是如果想要识别中英文的话,还得继续谷歌搜索一下,在这里就不列出来了。
Java中识别的话很简单,只需要下面这几行代码就可以了(官方给出来的代码)

File imageFile=new File(path);
if(!imageFile.exists()){
return"图片不存在";
}
Tesseractinstance=Tesseract.getInstance();
instance.setDatapath("C:\\ProgramFiles(x86)\\Tesseract-OCR\\tessdata");//设置训练库的位置
instance.setLanguage("chi_sim");//中文识别
String result=instance.doOCR(imageFile);

想要实现上面的这些代码,需要导入的包有一些,

下载地址:http://download.csdn.net/detail/wsk1103/9731338

关于异常
1. Exception in thread “main” java.lang.Error: Invalid memory access
这个异常表示没有设置训练库的位置
2. 不是有效的win32程序
尝试重新安装一下tesseractocr
安装的路径默认就可以了。

最新文章

  1. Python-socket网络编程
  2. hdu 4025 2011上海赛区网络赛E 压缩 ***
  3. 基于 ThinkPHP 3.2.3 的页面静态化功能的实现
  4. Hadoop学习篇 2 初识 Hadoop
  5. android 内存泄露调试
  6. Python常见数据结构--列表
  7. java中将汉字转换成16进制
  8. Loadrunner:error -86401 Failed to connceted xxx.xxx.xxx.xxx:25问题解决
  9. selvert的过滤器filter处理中文乱码
  10. RestKit:iOS开发必备,告别众多无聊代码
  11. leetcode_Substring with Concatenation of All Words
  12. 久未更 ~ 五之 —— 引入外部CSS样式表 小节
  13. [题解]邮递员寄信(luoguP1629)
  14. 241. String to Integer
  15. centos7以rpm方法装mysql5.7及大坑
  16. ahoi2009维护序列
  17. c#操作数据库的增删改查语句及DataGridView简单使用
  18. day12:装饰器的进阶
  19. Java正则表达式校验
  20. py-day2-2 python 元祖

热门文章

  1. UVALive 6908 Electric Bike dp
  2. Linux __attribute__(("hidden"))、default
  3. linux和mac
  4. 2018 dnc .NET Core、.NET开发的大型网站列表、各大公司.NET职位精选,C#王者归来
  5. 没用过的函数 GetHomePath - 获取用户程序数据目录
  6. python及扩展程序安装
  7. IIS、Asp.net 编译时的临时文件路径
  8. python服务端内存泄露的处理过程
  9. 浅析CentOS和RedHat Linux的区别
  10. 对一个前端使用AngularJS后端使用ASP.NET Web API项目的理解(1)