Fast RCNN中RoI的映射关系
2024-09-07 07:46:50
写在前面:下面讨论中Kernel Size为奇数,因为这样才能方便一致的确认Kernel中心。
在Fast RCNN中,为了大大减少计算量,没有进行2k次运算前向运算,而是进行了1次运算,然后在从pool5中crop出SS图片所对应的Feature map,这里详细的介绍一下是如何实现的。在CNN中下一层Feature map大小的计算中已经提到了如何down to up来计算Feature map,其中最关键的部分就是除了最后一个的长度是K以外,前面所有的长度都是S。
下面先画一个图来描述具体的对应关系。
画是挺好画的,可是如何用公式来进行描述呢?
首先,对于右图上的任意一点(x,y)应该承认,从0到x-1的每一个点在左图中对应的长度应该是S。可以这样理解,将(x,y)当作是右图的右下角,那么这就回到了《CNN中下一层Feature map大小的计算》中的问题。应该理解了吧,如果不理解那就自己画一下。
对于x这点,对应是Kernel的中心,因此,对应的坐标应该是$(x-1)*S+\frac{K-1}{2}+1$。
如果考虑到padding的话,应该在减去padding的值,因此最后的公式为:$(x-1)*S+\frac{K-1}{2}+1-padding$。
Fast RCNN中是找到SS中左上角和右下角在Pool5 Feature Map中的位置,然后crop出来,直接将其作为SS经过CNN网络后对应的Feature Map,就这样子。
其实这个东西用语言描述还是挺弱的,还是自己多画一下,体会一下,这个东西不复杂。
最新文章
- 关于反射blog
- 【spring bean】 spring中bean之间的引用以及内部bean
- php关于金额比较引发的问题(转)
- [OpenCV] Install openCV in Qt Creator
- [css3]搜索框focus时变长
- Dubbo的Maven打包
- SVN中tag branch trunk用法详解
- PreferenceActivity详解
- MVC发布网站
- NOIP-数字反转
- Python+Pycharm—学习1—封装&;导入
- mybatis数据源与连接池
- python_08 函数式编程、高阶函数、map、filter、reduce函数、内置函数
- C# 图像处理: 获取当前活动窗口句柄,获取窗口大小及位置
- h5实现手机端等级进度条
- 剑指offer:二叉搜索树的后续遍历序列
- Java多线程学习篇——线程的开启
- 20145205 武钰 《网络对抗》Exp8 Web基础
- Spring持久化
- vscode配置python环境