Tuning process

下图中的需要tune的parameter的先后顺序, 红色>黄色>紫色,其他基本不会tune.

先讲到怎么选hyperparameter, 需要随机选取(sampling at random)

    

随机选取的过程中,可以采用从粗到细的方法逐步确定参数

  

有些参数可以按照线性随机选取, 比如 n[l]

  

但是有些参数就不适合线性的sampling at radom, 比如 learning rate α,这时可以用 log

  

  

Andrew 很幽默的讲到了两种选参数的实际场景 pandas vs caviar. pandas approach 一般用在你的算力不够时候,要持续几天的training.

  

Batch norm

我们知道对input layer 做 normalizing, 其实对每一层的输入都可以做normalizing, 这就是 batch norm. 做batch norm 时,有对 activation后的结果做norm 的,也有对activation 前的结果 z 做batch norm 的,这里讲的是后一种,对z 做norm.

  

  

  

  

为什么Batch Norm 起作用呢?

先看下下面图讲到的convariate shift,如果traing set 的distribution 变了,就应该重新train model. 同样,对NN的每一层也有类似的问题.

  

Andrew讲到batch norm 是为了尽量使得不同layer decouple,这样相互影响就要小一点,整个NN比较稳定.

  

Batch norm 还有regularization 的作用,但是这个算法主要不是做这个的. 不建议专门用它来做regularization.

  

对 test set 求 μ, σ2, 采用了不一样的方法,就是基于签名mini-batch set 求出来的μ, σ2 应用exponetially weighted average 求平均值. 它和logistic regression 一样,decision boudary 是线性的.

  

Softmax Regression

Softmax regression 就是 logistic regression 的generaliazation 版本, 它可以用在multi-class clarification 问题上。和logistic regression 一样,decision boudary 都是线性的. 如果要使得decison boudary 是非线性的就需要deep network.

  

  

  

Programing framework

TensorFlow by google, an example

  

最新文章

  1. C#设计模式-桥接模式
  2. Python’s SQLAlchemy vs Other ORMs[转发 3]Django's ORM
  3. Maven的包依赖冲突可引发java.lang.IncompatibleClassChangeError错误
  4. Ubuntu14.04下安装Hadoop2.4.0 (单机模式)
  5. linux下动态链接库解决方案(一)
  6. 如何导入大sql文件到虚拟主机mysql数据库
  7. SVG操作插件:SVG.JS 个人提取部分实用中文文档
  8. GoJS研究,简单图表制作。
  9. CSS的伪类和伪元素
  10. English - because of,due to ,thanks to ,owing to ,as a result of ,on account of解析
  11. 【转载】Android中ListView下拉刷新的实现
  12. jmeter测试dubbo接口
  13. htaccess 实现网址缩短
  14. HighCharts之2D柱状图、折线图的组合双轴图
  15. 爱奇艺技术分享:爱奇艺Android客户端启动速度优化实践总结
  16. 教你搞定ElasticSearch(head)
  17. bzoj2973转移矩阵构造法!
  18. Java虚拟机垃圾回收:内存分配与回收策略 方法区垃圾回收 以及 JVM垃圾回收的调优方法
  19. PythonStudy——数字类型 Number type
  20. 开发增强现实(AR)教程——识别图的那些坑

热门文章

  1. CF 1013E Hills
  2. bzoj2553 禁忌
  3. Python模块之time、random、os、sys、序列化、re
  4. java 分隔函数split("",-1)的用途
  5. Ubuntu: Windows Help Tools For Ubuntu
  6. gulp入门指南
  7. percona-5.7二进制多实例安装
  8. Mysql数据约束 整理
  9. 怎么停止yum安装并kill进程
  10. JAVA核心技术I---JAVA基础知识(常量设计和常量池)