旧版本的API:
 
—Google提供了一个在线语音识别的API接口,通过该API可以进行中文、英文等语言的识别。
 API地址:http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=1
  —参数解释: 

xjerr:错误标准

client: 客户端类型

lang:待识别语言类型,en-US是英文,中文为zh-CN,

maxresults:最大返回识别结果数量

—识别基本流程:
    • 从音频输入设备获取原始音频并编码或直接调用音频文件。
    • 将音频POST至接口地址。
    • 分析处理返回的JSON并得出结果。
—请求接口
    • 地址:如前
    • 请求方式:http post
    • 请求数据:编码后的音频数据
    • 音频编码格式:wav、speex或flac。
    • 音频采样频率:8000Hz、11025Hz、16000Hz、22050Hz、24000Hz、32000Hz、44100Hz、48000Hz
—主要优点
◦语音识别引擎庞大,识别精度很高,适用于文本语音识别。提供多国语言的语音识别。
◦任何平台都可以进行访问,容易使用。
—主要缺点
◦API未开放,未能获知具体开发细节。
◦识别引擎位于服务器端,识别的速度和网络质量有关,识别速度较慢。
◦待识别音频的格式、大小、时长的限制。
 
新版本的API:
   
api:地址: https://www.google.com/speech-api/v2/recognize?output=json&lang=en-us&key=yourkey
主要说一下变化:
URL路径: 之前的V1变成V2 参数: 新增output:输出类型,我们一般用json
新增KEY:需要去goole注册帐号,申请apikey,如果你不懂请google
其他的参数都能够继续使用 相关文档:

谷歌官方开源代码: https://www.google.com/speech-api/v2/recognize

谷歌开发者Key申请地址:https://console.developers.google.com

最新文章

  1. 寒冬之下,浩瀚智能开单收银打印扫描POS为何能在批发零售门店商场 车销行业 风靡!:进销存+打印扫描POS机
  2. PL/SQL Developer如何连接64位的Oracle图解
  3. HK一行所见闻
  4. 在Ubuntu上如何往fcitx里添加输入法
  5. R语言实现数据集某一列的频数统计——with和table
  6. poj2482Stars in Your Window(线段树+离散化+扫描线)
  7. codevs 3269 混合背包
  8. jQuery中bind,live,delegate与one方法的用法及区别解析
  9. String.Format in Java and C#
  10. JavaScript中Global、Math、Date对象的常用方法
  11. SQL得到任意一个存储过程的参数列表sp_procedure_params_rowset
  12. case语法
  13. vue之props父子组件之间的谈话
  14. 最新Windows下c++读写锁SRWLock介绍
  15. 打开ubuntu终端的两个方法【最快速】
  16. 调用weka模拟实现 “主动学习“ 算法
  17. Kettle变量和自己定义java代码的实例应用
  18. .net垃圾回收
  19. C#启动外部程序以及等待外部程序关闭的几种方法
  20. Web中树形数据(层级关系数据)的实现—以行政区树为例

热门文章

  1. pika教程
  2. rest-assured的日志使用介绍
  3. P2801 教主的魔法
  4. 最小生成树----prim算法的堆优化
  5. vue+webpack新项目总结1
  6. pageHelper 分页插件使用
  7. mutillidae之Insert型注入
  8. CSS2.1
  9. Tortoise SVN安装后右键没有菜单的解决方法
  10. (转)[Nginx] – 配置文件优化 [一 ,二]