1、合并图片
打开jtessboxeditor,点击Tools->Merge Tiff ,按住shift键选择前文提到的101个tif文件,并把生成的tif合并到新目录d:\python\lnypcg\new下,命名为langyp.fontyp.exp0.tif。
注意:langyp 是本人定义的语言名称,fontyp是本人定义的字体名称,后续都会用到,你可以修改成你喜欢的名字。
2、生成box文件
tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 batch.nochop makebox
tesseract需要一个‘box’文件来定位每个训练图像。box文件是一个文本文件,它在每行列出了训练图像的字符,以及围绕bounding box的坐标。
3、修改box文件
切换到jTessBoxEditor工具的Box Editor页,点击open,打开前面的tiff文件langyp.fontyp.exp0.tif,工具会自动加载对应的box文件。
4、生成font_properties
echo fontyp 0 0 0 0 0 >font_properties
<fontname> <italic> <bold> <fixed> <serif> <fraktur>
当<fontname>是一个字体的字符串名,并且<italic>, <bold>, <fixed>, <serif> and <fraktur> 是所有简单的0 或 1标记,表示字体具有命名属性。
5、生成训练文件
tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 nobatch box.train
6、生成字符集文件
unicharset_extractor langyp.fontyp.exp0.box
7、生成shape文件
shapeclustering -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr
8、生成聚集字符特征文件
mftraining -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr
9、生成字符正常化特征文件
cntraining langyp.fontyp.exp0.tr
10、更名
rename normproto fontyp.normproto
rename inttemp fontyp.inttemp
rename pffmtable fontyp.pffmtable
rename unicharset fontyp.unicharset
rename shapetable fontyp.shapetable
11、合并训练文件,生成fontyp.traineddata
combine_tessdata fontyp.

参考文档:http://wangjunle23.blog.163.com/blog/static/117838171201323031458171/
                  https://www.cnblogs.com/zhongtang/p/5555950.html

最新文章

  1. OAF 中的EO 和VO
  2. Binary Tree Non-recursive Traversal
  3. keyup、keydown和keypress
  4. bootstrap学习之三—插件
  5. [Selenium] 根据预期的日期格式,获取昨天的日期
  6. 通过yum安装nginx-mysql-php-fastcgi配置LNMP
  7. AutoMap1.0发布
  8. Linux系统上安装mysql数据库
  9. PowerDesigner 正向工程 和 逆向工程 说明
  10. 【转】Eclipse 中设置JVM 内存 -- 不错
  11. (转载)PHP解析URL并得到URL中的参数
  12. JBoss EAP6/AS7/WildFly: How to Use Properties Files Outside Your Archive--reference
  13. 【每日一摩斯】-Troubleshooting: High CPU Utilization (164768.1) - 系列5
  14. html中的rowspan和colspan
  15. leetcode第八题--String to Integer (atoi)
  16. 想在网上保持匿名?教你用Linux如何实现!
  17. 【bzoj4571&amp;&amp;SCOI2016美味】
  18. 2019-04-15 python深浅复制
  19. Function Composition vs Object Composition
  20. Stack Sorting CodeForces - 911E (思维+单调栈思想)

热门文章

  1. LVS之DR模式
  2. 使用arcpy.mapping 更新和修复数据源
  3. PHP学习之验证码类
  4. Linux下 安装jdk8
  5. Spring+Ibatis开发
  6. LINUX 的网站压力测试工具 webbench
  7. element-ui分页当前在哪一页,刷新页面保留当前分页
  8. Java NIO学习笔记九 NIO与IO对比
  9. aws S3存储概念
  10. Spring-Kafka —— KafkaListener手动启动和停止