我之前就注意到,深度学习和音乐结合,尤其是从乐理出发进行结合(而不是纯粹的进行音乐生成),是一个尚未被深度挖掘的全新领域。可想而知,这个方向符合我要求的数据肯定是要自己搜集了。

自己搜集的数据,在量上就已经输了,只是考虑到我们要做的任务并不复杂,准确的说只是一个分类器,再加一个LSTM而已。对于这个分类器,甚至不需要用卷积神经网络,可以使用一些其他的网络;而LSTM的样本本来就蕴含了很明确的规律,变化并不是很大。

那么我们就要开始思考,除了一些常规的训练方法,还有什么训练适合小样本数据吗?

1、数据扩增技术,例如图片的亮度改变、加噪声、翻转、随机裁切、缩放等制造出大量样本。

2、有人使用游戏来训练,例如使用GTA里面的场景来学习自动驾驶,当然这不属于严格的小样本。

3、使用生成模型,例如GAN来生成大量接近真实的样本来训练。苹果的第一篇AI论文simGAN就是这么做的。

4、经典的特征提取算法,再使用SVM等浅层网络来训练,需要的数据量就没有那么多。

来源:知乎

这几个思路都算还行,当然还有其他的思路。
5,贝叶斯规划学习(Bayesian Program Learning,BPL)
以及:
6,利用先验知识。
 
对于1,这是一个可行的办法,只是我们使用的数据集只是网络图片,处理网络图片比处理本地图片要困难。
对于2,这个不适合我们的问题。
对于3,问题同1.
对于4,这是一个很好的解决办法,我们实际上就是使用了一种广义的特征提取算法(提取了实体,再进行向量化)
对于5,看起来是一个很高深的知识……我现在还不是很懂。
对于6,这个同样不是很懂,得问一下师兄师姐才能得到答案。
 
 
我个人觉得,对于抽象了图片特征,转化成向量,这样就已经降低了对样本集本身的要求。对于网络结构的改进,我期望能尽量避免over-fitting。
 

最新文章

  1. js中substr,substring,slice。截取字符串的区别
  2. a 标签中加 onclick事件,根据事件中的校验情况来决定是否执行a标签的链接
  3. 一个简单的游戏开发框架(四.舞台Stage)
  4. Jenkins_获取源码编译并启动服务(一)
  5. BOOL in Object-C
  6. <<google软件测试之道>>读书笔记
  7. 窗口类(Window Class)概述
  8. [mysql] 一次sql耗时高引发报警的分析和处理
  9. C/C++ 位域
  10. 图像处理函数详解——im2bw
  11. c++学生成绩管理系统
  12. SSIS 数据流的连接和查找转换
  13. 超级素数幂 java
  14. 微信开发中access_token,js_ticket,时间戳,签名生成工具
  15. 解决Windows服务无法访问网络映射盘的问题
  16. mysql的表映射
  17. Win10 64位连接LJM1005打印机局域网访问
  18. Echarts Map 值域为小数的原因
  19. Docker实战-为镜像添加SSH服务
  20. 余玄相似度,TF-IDF

热门文章

  1. linux控制USB的绑定/解绑
  2. js中的"=="和equals()以及is()三者的区别
  3. John 尼姆博弈
  4. Go语言调度器之盗取goroutine(17)
  5. Java基础--常用API--字符串相关API
  6. 前端JavaScript(2) --常用内置对象,函数,伪数组 arguments,关于DOM的事件操作,DOM介绍
  7. 我所接触到的JWT
  8. SSIS连接-左外连接
  9. PSS下载助手(PSX Download Helper)1.7.6.1发布
  10. C#使用GZipStream实现压缩和解压缩