有的时候我们训练网络的时候,数据集在收集的过程中由于种种原因导致图像收集的不完整,比如某些种类很少,或者没有,这个时候我们就可以考虑自己生成数据集. 这个和data augmentation还不太一样,data augmentation是在数据集上做一些变化,得到更多的数据,数据生成是直接生成一些数据集. 在做OCR识别的时候,因为有些类型的数据量很少,所以就考虑了一下数据生成的方法. 安装 imagemagick 工具 imagemagick 工具,可以用来生成不同字体的图像. imagema