吴恩达机器学习笔记60-大规模机器学习(Large Scale Machine Learning)
2024-10-12 20:01:23
一、随机梯度下降算法
之前了解的梯度下降是指批量梯度下降;如果我们一定需要一个大规模的训练集,我们可以尝试使用随机梯度下降法(SGD)来代替批量梯度下降法。
在随机梯度下降法中,我们定义代价函数为一个单一训练实例的代价:
随机梯度下降算法为:首先对训练集随机“洗牌”,然后:
下面是随机梯度下降算法的过程以及和批量梯度下降算法的异同:
随机梯度下降算法是先只对第1个训练样本计算一小步的梯度下降,即这个过程包括调参过程,然后转向第2个训练样本,对第2个训练样本计算一小步的梯度下降,这个过程也包括调参,接着转向第3个训练样本.......
批量梯度下降和随机梯度下降算法的收敛过程是不同的,实际上,随机梯度下降是在某个靠近全局最小值的区域内徘徊,而不是真的逼近全局最小值并停留在那个点,不过其最终也会得到一个很接近全局最小值的参数。这对于绝大多数的实际应用的目的来说,已经足够了。
随机梯度下降算法收敛比较快。
二、随机梯度下降算法的收敛
在批量梯度下降中,我们可以令代价函数
最新文章
- Reporting Service 配置SMTP和设置订阅出现的异常
- GJM : 用Unity模仿CSGO里的火焰效果 [转载]
- Excel 使用CHIINV函数和GAMMA.DIST函数绘制卡方分布
- 安装Eclipse插件
- Linux防火墙(Iptables)的开启与关闭
- Flume简介与使用(二)——Thrift Source采集数据
- App开发中甲乙方冲突会闹出啥后果?H5 APP 开发可以改变现状吗
- CSharp设计模式读书笔记(24):访问者模式(学习难度:★★★★☆,使用频率:★☆☆☆☆)
- orientationchange
- 第三章(附)mysql表类型MyISAM和InnoDB区别(决定了是否支持事务)
- DNA序列对齐问题
- 如何在PHP7中安装mysql的扩展
- JS对象、构造器函数和原型对象之间的关系
- spring mvc中的service和controller中读取不到properties值
- Luogu1967 NOIP2013 货车运输 最大生成树、倍增
- Python进行MySQL数据库操作
- Poisson Blending(Seamless clone)研究和实现
- Dalvik VM (DVM) 与Java VM (JVM) 的区别?
- JAVA动态性之一一反射机制reflection
- C#设计模式之简单工厂模式(过渡模式)
热门文章
- 磁盘上没有足够的空间完成此操作的解决办法_Windows小知识
- Kali Linux图形界面与命令行界面的切换
- Ubuntu 18.04 on Windows 10 更改 Oh-My-Zsh agnoster 主题下的目录背景色
- vue2.0填坑有感(持续更新ing)
- 你不知道的JavaScript--Item24 ES6新特性概览
- ucloud发送短信的php sdk
- 巩固java(六)----java中可变参数方法(非常实用哦)
- 【Never Stop】联赛集训记录
- 【NOIP2011】 聪明的质监员
- BZOJ_3831_[Poi2014]Little Bird_单调队列优化DP