SRILM是一个建立和使用统计语言模型的开源工具包,从1995年开始由SRI 口语技术与研究实验室(SRI Speech Technology and Research Laboratory)开发,现在仍然不断推出新版本,被广泛应用于语音识别.机器翻译等领域.这个工具包包含一组C++类库.一组进行语言模型训练和应用的可执行程序等.利用它可以非常方便地训练和应用语言模型.给定一组连续的词,调用SRILM提供的接口,可以得到这组词出现的概率. http://www.jianshu.com/p/5b1
MICAPS系统的数据结构是建立在文件系统基础上的.其特点是: l 利用目录来区分不同的数据来源.要素和层次,即不同的数据来源.要素和层次的数据要放在不同的目录中.同一目录中的数据只能有时次或时效上的不同. l 系统根据不同的数据格式来显示不同类型的图形.除第六类数据(传真图)外,每个数据文件都有一个文件头,描述该数据文件属于哪一类数据格式.数据的日期.时次.时效及其它有关参数. l 除第6和13类数据(图象)外,数据文件均为文本文件. 下面描述各种数据类型的文件格式. 第一类数据格式: