在ubuntu上利用科大讯飞的SDK实现语音识别-语义识别等功能
2024-08-30 18:41:08
首先,参考科大讯飞的官方sdk中的案例,实现和机器的日常对话和控制。
具体步骤:
1. 通过麦克风捕获说话的声音,然后通过在线语音识别获取语音中的字符。
2. 将获取到的字符上传到科大讯飞的语义识别中,获得返回回来的信息。(json格式)
3. 将返回的数据通过cjson库进行解析,获取到我们想要的数据。
4. 将获取到的结果上传到科大讯飞的库中,进行语音合成,获取到合成的语音数据。
5. 通过alsa库输出声音。
具体的代码已经上传到github中。
https://github.com/qq2216691777/xf_voice
最新文章
- android 透明度
- urllib.urlretrieve的用法
- bootloader制作过程
- JavaScript实现MVVM之我就是想监测一个普通对象的变化
- canvas实现绘画
- 大数记录之,大数乘整型数nyoj832
- HDU 2196 树形DP Computer
- 怎么捕获和记录SQL Server中发生的死锁
- Nginx 配置指令的执行顺序(七)
- hibernate它 10.many2many单向
- ThinkPHP框架的增删改
- Table样式设置
- NCBI下载sra数据(新)
- Python 常用Web框架的比较
- Oracle初级优化sql
- Jvm的体系结构
- Java提高篇(1)封装
- 归并排序详解(python实现)
- everything 提供http和ftp的功能
- ASP.NET学习笔记(4)——上传图片
热门文章
- C语言memset用法
- java43
- 010 editor的使用
- Python【Python基础】
- 莫比乌斯反演进阶-洛谷P2257/HDU5663
- moviepy1.03音视频剪辑:使用manual_tracking和headblur实现追踪人脸打马赛克
- [BJDCTF2020]ZJCTF,不过如此 php伪协议, preg_replace() 函数/e模式
- Javascrip之BOM
- LeetCode初级算法之字符串:344 反转字符串
- vertical-align什么时候使用?常用的值分别有什么作用?