Progressive NN

Progressive NN是第一篇我看到的deepmind做这个问题的。思路就是说我不能忘记第一个任务的网络,同时又能使用第一个任务的网络来做第二个任务。

为了不忘记之前的任务,他们的方法简单暴力:对所有的之前任务的网络,保留并且fix,每次有一个新任务就新建一个网络(一列)。

而为了能使用过去的经验,他们同样也会将这个任务的输入输入进所有之前的网络,并且将之前网络的每一层的输出,与当前任务的网络每一层的输出一起输入下一层。

每次有一个新的任务,就重新添加一列,然后将前几列的输出fuse到当前列来。

比如说,如果两个任务的low level特征类似,则当前任务网络中的前几层可能完全没有用处,只需要用之前任务的输出就够了。

但是一个很明显的问题是,这个网络不能学到自己的low level feature的网络,然后使用之前网络的high level决策。因为1,当low level不一样的时候,将输入输入之前的网络就不make sense了;更重要的是,当前列的输入根本无法输入进之前列的网络,只复用高层网络根本无从谈起。

所以这里的限制就是,两个任务需要有类似的low level feature。当然啦,这篇文章还是有很酷的视频,也确实用到了一些任务上。

用几句话就能够说明白这个所谓的progressive neural networks到底是什么了!简直不能再简单!

就是:

Step 1:构造一个多层的神经网络,训练某一个任务,上图第一列

Step 2:构建第二个多层的神经网络,然后固定第一列也就是上一个任务的神经网络,将上一列的神经网络的每一层(注意是每一层)都通过a处理连接到第二列的神经网络的每一层作为额外输入。也就是第二个神经网络每一层除了原始的输入,还加上经过a处理的之前的神经网络对应层的输入。

Step 3:构建第三个多层神经网络,训练第三个任务,将前两列的神经网络固定,然后同上一样的方法连接到第三个神经网络中。

上图的线很清楚的表示了这个过程。

这就是把神经网络和神经网络连起来的方法!

a的作用其实主要是为了降维和输入的维度统一(与原始输入匹配),用简单的MLP来表示!

除此之外,增强学习算法没有任何变化。文章中使用A3C算法,一个比DQN强4倍的算法!

总的来说,就是抽取之前的神经网络的信息与当前的输入信息融合,然后训练!训练的效果就可以和没有加前面的神经网络的方法对比,如果效果好很多说明前面的神经网络有用,知识有迁移!

这种方法的好处就是之前的训练都保留,不至于像fine tune那样更改原来的网络!而且每一层的特征信息都能得到迁移,并且能够更好的具化分析。

缺点就是参数的数量会随着任务的增加而大量增加!并且不同任务的设计需要人工知识。

最新文章

  1. 劈荆斩棘:Gitlab 部署 CI 持续集成
  2. BootStrap的一个标准框架的内容解释——来源于bootstrap官网
  3. response.write();改变页面布局的原因及解法
  4. Dapper的基本使用
  5. PHP Datatype Conversion Safety Risk、Floating Point Precision、Operator Security Risk、Safety Coding Principle
  6. Erlang 104 OTP
  7. HDU 1016 Prime Ring Problem(经典DFS+回溯)
  8. 在fortran下进行openmp并行计算编程
  9. linux的nohup命令的用法
  10. 大数据和Hadoop生态圈
  11. Android JNI(NDK)开发总结
  12. js 第一天
  13. Maven(十四)Maven 继承
  14. .Net EF6+Mysql 环境搭建
  15. 2018-08-22 为中文API的简繁转换库添加迟到的持续集成
  16. springmvc转页面
  17. mybatis 根据参数映射对应模型
  18. backbone学习笔记:视图(View)
  19. ubuntu下安装vsftpd及vsftpd配置文件不见的解决办法
  20. table获取checkbox是否选中的几种方法

热门文章

  1. [Spring学习笔记 2 ]装配各种类型的属性 map,list,array,null,properties
  2. ROS学习(九)—— rqt_console 和 roslaunch
  3. Python3 命令行参数
  4. Desugar Scala(17) -- Option和for,以及脑子里发生的事情
  5. 题目要求:将a,b两个数的值进行交换,并且不使用任何的中间变量。
  6. 什么是Web缓存控制(基于HTTP头域)
  7. lnmp 一键安装
  8. 91平台iOS接入demo
  9. 比较有用的sql语句
  10. 使用ScriptEngineManager解析json