转载自CSDN, CReLU激活函数

CReLU 一种改进 ReLU 激活函数的文章,来自ICML2016.

1. 背景介绍

整个文章的出发点来自于下图的统计现象:

为了看懂上图。

(1)首先介绍一下余弦相似度(cos距离)的概念

cos距离的取值范围是 [-1,+1],距离越接近-1,表示两个向量的方向越相反,即呈负相关关系。


(2)再来介绍一下 pair filter的定义

一个卷积层有 \(j=1, \cdots, n\) 个卷积核(filter), 一个卷积核 \(ϕ_i\) 对应的 pairing filter 定义为

\[ϕ_i = argmin_{ϕ_j}cos<ϕ_i, ϕ_j>\]

即从所有卷积核中选择一个cos相似度最小的卷积核。

我们再回头看上图。 对所有卷积核寻找其 pair filter,并计算cos相似度得到蓝色的统计直方图。 红色的曲线,是假设随机高斯分布生成的卷积核得到的相似度统计。

现象:网络的前部,参数的分布有更强的负相关性(类似于正负对立)。随着网络变深,这种负相关性逐步减弱。
结论:网络的前部,网络倾向于同时捕获正负相位的信息,但ReLU会抹掉负响应。 这造成了卷积核会存在冗余。

2. CReLU

CReLU的定义很简单:

\[\text{CReLU(x)= Concat[ ReLU(x), ReLU(−x) ]}\]

输出维度会自动加倍。 比如

\[ [−3, 1] \rightarrow \begin{matrix}
[[0&1], \\ [3&0]] \\
\end{matrix}\]

在网络中的实现也很简单,甚至不用修改代码(通过scale层取反再经过一次ReLU)

最新文章

  1. PHP数据采集curl常用的5个例子
  2. CSS+Javascript
  3. HTML 速查列表
  4. BZOJ-1834 网络扩容 最小费用最大流+最大流+乱搞
  5. sql server 向oracle导入表
  6. JQueryMobile页面跳转参数的传递解决方案
  7. 自己编写的基于VC++6.0的串口调试软件,并贡献源程序!
  8. Windows下的 mysql 5.5主从同步配置
  9. [置顶] android之存储篇_SQLite数据库_让你彻底学会SQLite的使用
  10. Matrix, Her, Transcendence
  11. Java数据结构习题_算法分析
  12. 2014.12.01 B/S之windows8.1下安装IIS
  13. .net EF 事物 订单流水号的生成 (一)
  14. 单源最短路径(1):Dijkstra 算法
  15. VS2010安装Boost库
  16. 随想:目标识别中,自适应样本均衡设计,自适应模型结构(参数可变自适应,模型结构自适应,数据类别or分布自适应)
  17. 剑指offer例题分享--8
  18. CSS3布局之多列布局columns详解
  19. CSS 实现单、多行文本溢出显示省略号(…)
  20. 背水一战 Windows 10 (74) - 控件(控件基类): UIElement - 与 CanDrag 相关的事件, 与 AllowDrop 相关的事件

热门文章

  1. C# 使用微软自带的Speech进行语音输出
  2. C语言中可变参数的函数(三个点,“...”)
  3. ARC089E GraphXY 构造
  4. iOS开发基础-UIScrollView实现图片缩放
  5. python部署lvs
  6. 想要开发自己的PHP框架需要那些知识储备?
  7. C++/CLI泛型应用
  8. js身份证正则
  9. python之旅九【第九篇】socket
  10. Magento 2 创建 Widget