Architecture:

  整个网络8层,5个卷积层,3个全连接层

  Relu Nonlinearity:

    非饱和的relu比饱和的sigmoid或者tanh训练速度快很多,并有效解决梯度消失

  Overlapping Pooling:

    论文中整个网络都使用重叠网络,分别降低top-1、top-5的错误率0.4%、0.3%,并且发现会是网络更加难以过拟合。

Reducing Overfitting:

  Data Augmentation:

    最简单和最常用的减少过拟合的方式是人为地扩大数据集。数据增强有两种方式,这两种方式都是对原图像进行很少的计算,不需要存储在硬盘上。

    1.图像转换和水平翻转。分别从256x256大小的原图像和翻转图像中随机提取224x224大小的块来增加图像数量。没有足够的数据,将限制网络的大小。

    2.改变RGB通道的强度。

  Dropout:

    每次训练,dropout随机选择不参与网络的神经元(既不参与前向传播、也不参与反向传播),相当于每次产生不同的网络结构,但他们是权值共享的,最后训练出来的模型相当于把这些模型结合起来,这种方式有效防止过拟合。

http://blog.csdn.net/liumaolincycle/article/details/50496499  翻译

最新文章

  1. Local gulp not found in.. on windows
  2. IOS 类似微博,#话题#,@人,[表情] 网址 正则匹配
  3. iOS 阶段学习第十天笔记(字符串操作)
  4. poj 1458 Common Subsequence
  5. Leetcode: Trapping Rain Water II
  6. react tab
  7. Spring+SpringMVC+MyBatis)
  8. SharePoint自动化系列——Add/Remove "Record" from items
  9. Embed对象
  10. php5.3.3安装mongo扩展
  11. 安装notepad++之后怎样在鼠标右键上加上Edit with notepad++
  12. easyui page添加文本,js验证码
  13. sql级联删除
  14. 201521123057 《Java程序设计》第4周学习总结
  15. .Neter玩转Linux系列之四:Linux下shell介绍以及TCP、IP基础
  16. JavaScript:方法&对象大全
  17. 1.6部署到CentOS「深入浅出ASP.NET Core系列」
  18. 商米D1S一体机设置搜狗手写输入法图解
  19. 给dataframe添加一列索引
  20. sass学习小记

热门文章

  1. 实现类似tail -f file功能
  2. 在Spark shell中基于HDFS文件系统进行wordcount交互式分析
  3. Beam概念学习系列之SDKs
  4. 初识backbone.js
  5. List< >泛型集合
  6. ASP.NET生命周期详解(转)
  7. C# HashTable 使用用法详解
  8. hello2详解
  9. 课堂笔记&总结与遇错纠错篇
  10. Eclipse org.eclipse.compare plug-in