Xception(Deep Learning with Depth-wise Separable convolutions)——google Inception-V3

Xception 并不是真正意义上的轻量化模型,只是其借鉴 depth-wise convolution,而 depth-wise convolution 又是上述几个轻量化模型的关键点,所以在此一并介绍,其思想非常值得借鉴。

创新点:

  1. 借鉴depth-wise convolution 改进 Inception V3
    Inception的假设是,卷积的时候要将通道的卷积和空间的卷积进行分离,这样比较好。

Inception V3 ——> Xception

下图 1 是 Inception module,图 2 是作者简化了的 inception module(就是只保留 1*1 的那条「路」,如果带着 avg pool,后面怎么进一步假设嘛~)

假设出一个简化版 inception module 之后,再进一步假设,把第一部分的 3 个 11 卷积核统一起来,变成一个 11 的,后面的 3 个 33 的分别「负责」一部分通道,如图 3 所示; 最后提出「extreme」version of an Inception,module Xception 登场,,先用 11 卷积核对各通道之间(cross-channel)进行卷积,如图 4 所示,

作者说了,这种卷积方式和 depth-wise convolution 几乎一样。

Xception 是借鉴 Rigid-Motion Scatteringfor Image Classification 的 Depth-wise convolution,是因为 Xception 与原版的 Depth-wise convolution 有两个不同之处

  • 第一个:原版 Depth-wise convolution,先逐通道卷积,再 11 卷积; 而 Xception 是反过来,先 11 卷积,再逐通道卷积;
  • 第二个:原版 Depth-wise convolution 的两个卷积之间是不带激活函数的,而 Xception 在经过 1*1 卷积之后会带上一个 Relu 的非线性激活函数;

    Xception 结构如上图所示,共计 36 层分为 Entry flow;Middle flow;Exit flow。。

Entry flow 包含 8 个 conv;Middle flow 包含 3*8 =24 个 conv;Exit flow 包含 4 个 conv,所以 Xception 共计 36 层。

Xception 小结:

Xception 是基于 Inception-V3,并结合了 depth-wise convolution,这样做的好处是提高网络效率,以及在同等参数量的情况下,在大规模数据集上,效果要优于 Inception-V3。这也提供了另外一种「轻量化」的思路:在硬件资源给定的情况下,尽可能的增加网络效率和性能,也可以理解为充分利用硬件资源。

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

 
 
 
 

最新文章

  1. IP报头
  2. vijos1426兴奋剂检查(多维费用的背包问题+状态压缩+hash)
  3. ASP.NET5 MVC6入门教学之一(自己动手)
  4. Java工程转换为Maven工程-b
  5. 一款仿36氪iOS版APP源码
  6. kubernetes组件
  7. Labview学习之程序Web发布
  8. Android自动测试之monkeyrunner工具
  9. Samba服务部署
  10. java 数字左补齐0
  11. Openstack1 云计算与虚拟化概念
  12. node.js监听文件变化
  13. Java中关于CyclicBarrier的使用
  14. VS2010.STL::list的一个bug
  15. 求n得阶乘得最后一位非零数字
  16. 【bzoj4537】 Hnoi2016—最小公倍数
  17. python 函数参数介绍
  18. nmap导出处理脚本
  19. 《python核心编程第二版》第3章习题
  20. [转] CentOS---网络配置详解

热门文章

  1. TortoiseGit状态图标不能显示
  2. php读取csv的问题
  3. 实现itoa()
  4. Spider Studio 新版本 (码年吉祥版) - 浏览器视图 / 脚本库上线!
  5. Linux crontab 实现每秒执行
  6. 在后台运行Python脚本服务
  7. div随页面滚动遇顶固定的两种方法(js&amp;jQuery)
  8. C++ 函数的扩展③--函数重载
  9. Oracle触发器修改数据时同步执行插入该条数据
  10. latex之图表位置控制