目标检测系列 --- RCNN: Rich feature hierarchies for accurate object detection and semantic segmentation Tech report
2024-09-02 04:09:55
目标检测系列 --- RCNN: Rich feature hierarchies for accurate object detection and semantic segmentation Tech report
1. Architecture:
- Region proposals: 使用selective search获取region proposals,对于每一幅图像获取约2000个region proposals,并将每一个proposal wrap到需要的size,论文中为224*224,之所以要wrap到同一size,是因为Feature extraction网络的输入需要固定的size
- Feature extraction: 使用AlexNet获取每一个region proposal的feature vector(4096维)。
- SVM: 对于每一个类别,使用SVM分类器对feature map进行打分,以判断当前region proposal是所对应的物体类别还是background。图像中的每个region都会给出对应的score,并对这些region使用贪心的非极大值抑制(non-maximum suppression)来获取具有较高IOU的region,如保留IOU大于threshold=0.3的region。
在Inference阶段,作者指出了两个关键属性:
- 对于每种类别,所有的CNN参数共享
- 和其他的方法相比,此模型的feature vector的维度相对较低
2. Training:
- pre-training: 在ILSVRC 2012的数据集上进行分类训练,feature map的输出为4096维,全连接层的输出为1000(1000类)。
- fine-tuning: 主要是对Architecture中的model进行稍微的改动。训练数据集为PASCAL VOC 2007,将最后一层全连接层的输出换成21(20类+背景)。并通过selective search得到的region proposal作为网络的输入。
- 物体类别分类器:对于一个二值的分类器,需要有包含正负标签的样本,本模型的方法是当region proposal的IOU大于threshold(比如:0.5)时,将其标记为positive,其余的为negative,以此来对每个类别训练一个linear SVM。
Reference:
最新文章
- IE10,11下_doPostBack未定义错误的解决方法
- Grid – 入门必备!简单易懂的响应式设计指南
- JAVA NIO中的Channels和Buffers
- 轻松认识JVM运行时数据区域(使用思维导图)
- hdu2025查找最大元素
- django-grappelli 安装配置
- 结构体struct和typedef后面接指针的含义
- Mysql 半同步复制配置
- CMDB处理数据流程
- Python3.2官方文件翻译--课堂笔记和异常是阶级
- intel hex 格式的几个链接
- MySQL表的创建
- python中如何将生成等差数列和等比数列
- B哥竟然也被裁了,聊一聊我的看法
- vue_eHungry 饿了么
- 数据库设计,表与表的关系,一对一。One-To-One(1)
- [PHP] 算法-根据前序和中序遍历结果重建二叉树的PHP实现
- django 403问题
- Spark核心RDD:combineByKey函数详解
- HDOJ 2003 求绝对值
热门文章
- Lintcode---实现 Trie
- .NET面试题(二)
- unity, break prefab instance
- Atitit.atiJsBridge 新特性v7q329
- [css]margin-top重叠
- Entity Framework ";There is already an open DataReader associated with this 的解决办法
- Android开发-状态栏着色原理和API版本号兼容处理
- iOS开发多线程篇 04 —线程间的通信
- CCNA2.0笔记_NAT
- MapReduce编程实例2