一、随机梯度下降算法  

  之前了解的梯度下降是指批量梯度下降;如果我们一定需要一个大规模的训练集,我们可以尝试使用随机梯度下降法(SGD)来代替批量梯度下降法。

在随机梯度下降法中,我们定义代价函数为一个单一训练实例的代价:

随机梯度下降算法为:首先对训练集随机“洗牌”,然后:

下面是随机梯度下降算法的过程以及和批量梯度下降算法的异同:

随机梯度下降算法是先只对第1个训练样本计算一小步的梯度下降,即这个过程包括调参过程,然后转向第2个训练样本,对第2个训练样本计算一小步的梯度下降,这个过程也包括调参,接着转向第3个训练样本.......

  批量梯度下降和随机梯度下降算法的收敛过程是不同的,实际上,随机梯度下降是在某个靠近全局最小值的区域内徘徊,而不是真的逼近全局最小值并停留在那个点,不过其最终也会得到一个很接近全局最小值的参数。这对于绝大多数的实际应用的目的来说,已经足够了。

  随机梯度下降算法收敛比较快。

二、随机梯度下降算法的收敛 

  在批量梯度下降中,我们可以令代价函数

最新文章

  1. Reporting Service 配置SMTP和设置订阅出现的异常
  2. GJM : 用Unity模仿CSGO里的火焰效果 [转载]
  3. Excel 使用CHIINV函数和GAMMA.DIST函数绘制卡方分布
  4. 安装Eclipse插件
  5. Linux防火墙(Iptables)的开启与关闭
  6. Flume简介与使用(二)——Thrift Source采集数据
  7. App开发中甲乙方冲突会闹出啥后果?H5 APP 开发可以改变现状吗
  8. CSharp设计模式读书笔记(24):访问者模式(学习难度:★★★★☆,使用频率:★☆☆☆☆)
  9. orientationchange
  10. 第三章(附)mysql表类型MyISAM和InnoDB区别(决定了是否支持事务)
  11. DNA序列对齐问题
  12. 如何在PHP7中安装mysql的扩展
  13. JS对象、构造器函数和原型对象之间的关系
  14. spring mvc中的service和controller中读取不到properties值
  15. Luogu1967 NOIP2013 货车运输 最大生成树、倍增
  16. Python进行MySQL数据库操作
  17. Poisson Blending(Seamless clone)研究和实现
  18. Dalvik VM (DVM) 与Java VM (JVM) 的区别?
  19. JAVA动态性之一一反射机制reflection
  20. C#设计模式之简单工厂模式(过渡模式)

热门文章

  1. 磁盘上没有足够的空间完成此操作的解决办法_Windows小知识
  2. Kali Linux图形界面与命令行界面的切换
  3. Ubuntu 18.04 on Windows 10 更改 Oh-My-Zsh agnoster 主题下的目录背景色
  4. vue2.0填坑有感(持续更新ing)
  5. 你不知道的JavaScript--Item24 ES6新特性概览
  6. ucloud发送短信的php sdk
  7. 巩固java(六)----java中可变参数方法(非常实用哦)
  8. 【Never Stop】联赛集训记录
  9. 【NOIP2011】 聪明的质监员
  10. BZOJ_3831_[Poi2014]Little Bird_单调队列优化DP