linux 安装Tesseract-OCR

准备工作:
一.编译环境:

1. gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)

yum install gcc gcc-c++ make

2. 依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上)

    autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:

yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

二. leptonica 需要源码编译安装

参考资料:

http://paramountideas.com/tesseract-ocr-30-and-leptonica-installation-centos-55-and-opensuse-113

http://www.leptonica.org/source/README.html

下载leptonica 包: http://www.leptonica.org/source/leptonica-1.68.tar.gz

解压后切换到leptonica-1.68 根目录

./configure ;
make ;
make install ;

三.tesseract安装:
 依赖安装完毕后开始安装tesseract
 下载tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz

解压后切换到tesseract-3.01 根目录

  --如果在make时遇到类似strngs.h:1: error: stray '\357' in program 的错误,请将tesseract-3.01/ccutil/strngs.h 文件转为ANSI 编码保存,再重新编译

./autogen.sh

./configure

make

make install

ldconfig

tesseract英文语言包安装:  
 下载tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
 解压后将tesseract-ocr/tessdata 下的所有文件全部拷贝到/usr/local/share/tessdata 下

安装完毕.
测试一下:
 切换到解压后的tesseract-3.01 根目录(这个目录下有一个自带的phototest.tif 可以做测试用)
 命令行:

tesseract phototest.tif phototest -l eng

输出:

Tesseract Open Source OCR Engine v3. with Leptonica

Page 

这时应该在当前目录生成一个phototest.txt 文本文件,内容就是phototest.tif 显示的文字.
 
  摘自 雪人的博客

最新文章

  1. CSS选择器的一些记录
  2. android 混淆文件proguard.cfg详解
  3. javascript 数组的深度复制
  4. WebApp MVC,“不一样”的轻量级互联网应用程序开发框架
  5. an optimal solution to the problem
  6. spoj 379
  7. linux下显卡信息的查看
  8. hdu4405:概率dp
  9. logstash 中的贪婪匹配
  10. Ural 1309 Dispute (递归)
  11. oracle 使用技巧
  12. 《RabbitMQ Tutorial》第 1 章 简介
  13. 想在Java中实现Excel和Csv的导出吗?看这就对了
  14. mysql原生sql盘点
  15. 153. Find Minimum in Rotated Sorted Array找其中的最小值
  16. information_schema系列七
  17. 基于Promise规范的fetch API的使用
  18. java面试2
  19. 【ZZ】C++静态库与动态库 | 菜鸟教程
  20. 使用Hexo + GitHub Pages 搭建个人博客

热门文章

  1. C语言多个源文件编译
  2. Linux上安装Redmine
  3. 关于Eclipse Modeling Framework进行建模,第二部分
  4. Cordova+angularjs+ionic+vs2015开发(四)
  5. CefSharp开源库的使用(一)
  6. PetaPoco更新记录方法
  7. vs调试windows mobile程序时布署时间太长的解决办法
  8. (转)boost::bind介绍
  9. Poj 1017 / OpenJudge 1017 Packets/装箱问题
  10. .NET小项目之MyKtv(歌曲播放功能实现)