MASK-RCNN是一个多用途的网络,可以用来做目标检测,实例分割或者人体姿态识别.主要结构如下.

简单的说,就是首先用Faster-RCNN获得ROI,再进行ROI Align,然后输出ROI的分类,同时输出分割掩码.

1. Faster-RCNN和ROI Align

Faster-RCNN是一个两阶段检测器,第一阶段(即RPN)提出候选ROI,再过滤掉一部分,第二阶段对剩下的ROI进行分类.

MASK-RCNN对Faster-RCNN做了修改,获得ROI以后并没有马上输出分类,而是进行了ROI Align.ROI Align通过双线性插值获得准确的特征图,而不是四舍五入以后的特征图.例如,如果输出的ROI坐标是[x/16],其中16是特征图步幅,[⋅]表示四舍五入,这样获得的特征图和ROI的坐标并没有完全对端,虽然对分类影响不大,但是对掩码的输出影响较大.ROI Align通过双线性插值获得准确的特征图,如下图所示.

最新文章

  1. SQL Server 常用内置函数(built-in)持续整理
  2. centos5安装salt-master
  3. ios NSLog常见使用
  4. html页面高亮关键词
  5. 腾讯云Linux系统中启动自己安装的tomcat
  6. tomcat部署https
  7. 优秀的PHP开源项目集合
  8. HangOver
  9. eclipse设置字体、背景(豆绿)色、自动提示
  10. PHP中取出字符串中的空格 逗号
  11. Python中如何调用Linux命令
  12. 驱动开发入门——NTModel
  13. VFS四大对象之四-struct file
  14. tty
  15. nginx设置默认server
  16. python基础一之课后作业:编写登录接口
  17. HoloLens开发手记 - 手势输入 Gesture input
  18. hdu 6185 递推+【矩阵快速幂】
  19. 胖子哥的大数据之路(10)- 基于Hive构建数据仓库实例
  20. 浅谈class私有变量

热门文章

  1. Nginx之HTTPS
  2. MySQL数据篇(八)-- 存储过程的简单实现
  3. add to explorer context menu需不需要勾选
  4. Codeforces Round #608 (Div. 2)
  5. JDBC简介(一)
  6. LeetCode解题笔记 - 4. Median of Two Sorted Arrays
  7. A bean with that name has already been defined in class path resource [org/springframework/transaction/annotation/ProxyTransactionManagementConfiguration.class] and overriding is disabled
  8. TCP协议 - 可靠性
  9. 红黑树之 原理和算法详细介绍(阿里面试-treemap使用了红黑树) 红黑树的时间复杂度是O(lgn) 高度<=2log(n+1)1、X节点左旋-将X右边的子节点变成 父节点 2、X节点右旋-将X左边的子节点变成父节点
  10. RocketMQ(4)---RocketMQ核心配置讲解