当预测值与目标值相差很大时,L2 Loss的梯度为(x-t),容易产生梯度爆炸,L1 Loss的梯度为常数,通过使用Smooth L1 Loss,在预测值与目标值相差较大时,由L2 Loss转为L1 Loss可以防止梯度爆炸。

L2 loss的导数(梯度)中包含预测值与目标值的差值,当预测值和目标值相差很大,L2就会梯度爆炸。说明L2对异常点更敏感。L1 对噪声更加鲁棒。

当差值太大时, loss在|x|>1的部分采用了 l1 loss,避免梯度爆炸。原先L2梯度里的x−t被替换成了±1, 这样就避免了梯度爆炸, 也就是它更加健壮。

总的来说:相比于L2损失函数,其对离群点、异常值(outlier)不敏感,可控制梯度的量级使训练时不容易跑飞。

最新文章

  1. Android UI体验之全屏沉浸式透明状态栏效果
  2. 防篡改php文件校验程序
  3. Javascript高级程序设计
  4. Flume学习——Flume的架构
  5. [jquery]基础篇--this与$this区别
  6. 《算法:C语言实现》阅读笔记
  7. bzoj4002
  8. Codeforces 241B
  9. 网易云课堂_程序设计入门-C语言_第六章:数组_1多项式加法
  10. hdu What Are You Talking About(map)
  11. 【bzoj2331】[SCOI2011]地板
  12. python: 列表的方法
  13. CodeForces666E Forensic Examination
  14. 第一册:lesson thirty three。
  15. Markdown语法参考
  16. Android接听、挂断电话
  17. 如何设置Vmware下Linux系统全屏显示
  18. idea 2018注册码(激活码)永久性的
  19. WinForm ListView不分页加载大量数据
  20. PAT——1024. 科学计数法

热门文章

  1. etcd常用命令-增删改查
  2. 【Linux 网络编程】数据在网络中传输过程(以ping命令为例)
  3. Servlet概念及与Jsp的区别
  4. Centos7安装Swoole
  5. scrapy架构图与执行流程
  6. 闭包、装饰器decorator、迭代器与生成器、面向过程编程、三元表达式、列表解析与生成器表达式
  7. Codeforces 1209F. Koala and Notebook
  8. scrapy框架设置代理ip,headers头和cookies
  9. 深入理解java虚拟机(3)垃圾收集器与内存分配策略
  10. vue项目--vuex状态管理器