MASK-RCNN(1)
2024-08-29 04:24:25
MASK-RCNN是一个多用途的网络,可以用来做目标检测,实例分割或者人体姿态识别.主要结构如下.
简单的说,就是首先用Faster-RCNN获得ROI,再进行ROI Align,然后输出ROI的分类,同时输出分割掩码.
1. Faster-RCNN和ROI Align
Faster-RCNN是一个两阶段检测器,第一阶段(即RPN)提出候选ROI,再过滤掉一部分,第二阶段对剩下的ROI进行分类.
MASK-RCNN对Faster-RCNN做了修改,获得ROI以后并没有马上输出分类,而是进行了ROI Align.ROI Align通过双线性插值获得准确的特征图,而不是四舍五入以后的特征图.例如,如果输出的ROI坐标是[x/16],其中16是特征图步幅,[⋅]表示四舍五入,这样获得的特征图和ROI的坐标并没有完全对端,虽然对分类影响不大,但是对掩码的输出影响较大.ROI Align通过双线性插值获得准确的特征图,如下图所示.
最新文章
- SQL Server 常用内置函数(built-in)持续整理
- centos5安装salt-master
- ios NSLog常见使用
- html页面高亮关键词
- 腾讯云Linux系统中启动自己安装的tomcat
- tomcat部署https
- 优秀的PHP开源项目集合
- HangOver
- eclipse设置字体、背景(豆绿)色、自动提示
- PHP中取出字符串中的空格 逗号
- Python中如何调用Linux命令
- 驱动开发入门——NTModel
- VFS四大对象之四-struct file
- tty
- nginx设置默认server
- python基础一之课后作业:编写登录接口
- HoloLens开发手记 - 手势输入 Gesture input
- hdu 6185 递推+【矩阵快速幂】
- 胖子哥的大数据之路(10)- 基于Hive构建数据仓库实例
- 浅谈class私有变量
热门文章
- Nginx之HTTPS
- MySQL数据篇(八)-- 存储过程的简单实现
- add to explorer context menu需不需要勾选
- Codeforces Round #608 (Div. 2)
- JDBC简介(一)
- LeetCode解题笔记 - 4. Median of Two Sorted Arrays
- A bean with that name has already been defined in class path resource [org/springframework/transaction/annotation/ProxyTransactionManagementConfiguration.class] and overriding is disabled
- TCP协议 - 可靠性
- 红黑树之 原理和算法详细介绍(阿里面试-treemap使用了红黑树) 红黑树的时间复杂度是O(lgn) 高度<;=2log(n+1)1、X节点左旋-将X右边的子节点变成 父节点 2、X节点右旋-将X左边的子节点变成父节点
- RocketMQ(4)---RocketMQ核心配置讲解