linux 安装Tesseract-OCR
linux 安装Tesseract-OCR
准备工作:
一.编译环境:
1. gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)
yum install gcc gcc-c++ make
2. 依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上)
autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:
yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
二. leptonica 需要源码编译安装
参考资料:
http://paramountideas.com/tesseract-ocr-30-and-leptonica-installation-centos-55-and-opensuse-113
http://www.leptonica.org/source/README.html
下载leptonica 包: http://www.leptonica.org/source/leptonica-1.68.tar.gz
解压后切换到leptonica-1.68 根目录
./configure ;
make ;
make install ;
三.tesseract安装:
依赖安装完毕后开始安装tesseract
下载tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz
解压后切换到tesseract-3.01 根目录
--如果在make时遇到类似strngs.h:1: error: stray '\357' in program 的错误,请将tesseract-3.01/ccutil/strngs.h 文件转为ANSI 编码保存,再重新编译
./autogen.sh ./configure make make install ldconfig
tesseract英文语言包安装:
下载tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
解压后将tesseract-ocr/tessdata 下的所有文件全部拷贝到/usr/local/share/tessdata 下
安装完毕.
测试一下:
切换到解压后的tesseract-3.01 根目录(这个目录下有一个自带的phototest.tif 可以做测试用)
命令行:
tesseract phototest.tif phototest -l eng
输出:
Tesseract Open Source OCR Engine v3. with Leptonica Page
这时应该在当前目录生成一个phototest.txt 文本文件,内容就是phototest.tif 显示的文字.
摘自 雪人的博客
最新文章
- CSS选择器的一些记录
- android 混淆文件proguard.cfg详解
- javascript 数组的深度复制
- WebApp MVC,“不一样”的轻量级互联网应用程序开发框架
- an optimal solution to the problem
- spoj 379
- linux下显卡信息的查看
- hdu4405:概率dp
- logstash 中的贪婪匹配
- Ural 1309 Dispute (递归)
- oracle 使用技巧
- 《RabbitMQ Tutorial》第 1 章 简介
- 想在Java中实现Excel和Csv的导出吗?看这就对了
- mysql原生sql盘点
- 153. Find Minimum in Rotated Sorted Array找其中的最小值
- information_schema系列七
- 基于Promise规范的fetch API的使用
- java面试2
- 【ZZ】C++静态库与动态库 | 菜鸟教程
- 使用Hexo + GitHub Pages 搭建个人博客
热门文章
- C语言多个源文件编译
- Linux上安装Redmine
- 关于Eclipse Modeling Framework进行建模,第二部分
- Cordova+angularjs+ionic+vs2015开发(四)
- CefSharp开源库的使用(一)
- PetaPoco更新记录方法
- vs调试windows mobile程序时布署时间太长的解决办法
- (转)boost::bind介绍
- Poj 1017 / OpenJudge 1017 Packets/装箱问题
- .NET小项目之MyKtv(歌曲播放功能实现)