目标检测系列 --- RCNN: Rich feature hierarchies for accurate object detection and semantic segmentation Tech report
1. Architecture:
  • Region proposals: 使用selective search获取region proposals,对于每一幅图像获取约2000个region proposals,并将每一个proposal wrap到需要的size,论文中为224*224,之所以要wrap到同一size,是因为Feature extraction网络的输入需要固定的size
  • Feature extraction: 使用AlexNet获取每一个region proposal的feature vector(4096维)。
  • SVM: 对于每一个类别,使用SVM分类器对feature map进行打分,以判断当前region proposal是所对应的物体类别还是background。图像中的每个region都会给出对应的score,并对这些region使用贪心的非极大值抑制(non-maximum suppression)来获取具有较高IOU的region,如保留IOU大于threshold=0.3的region。
 
在Inference阶段,作者指出了两个关键属性:
  • 对于每种类别,所有的CNN参数共享
  • 和其他的方法相比,此模型的feature vector的维度相对较低
 
2. Training:
  • pre-training: 在ILSVRC 2012的数据集上进行分类训练,feature map的输出为4096维,全连接层的输出为1000(1000类)。
  • fine-tuning: 主要是对Architecture中的model进行稍微的改动。训练数据集为PASCAL VOC 2007,将最后一层全连接层的输出换成21(20类+背景)。并通过selective search得到的region proposal作为网络的输入。
  • 物体类别分类器:对于一个二值的分类器,需要有包含正负标签的样本,本模型的方法是当region proposal的IOU大于threshold(比如:0.5)时,将其标记为positive,其余的为negative,以此来对每个类别训练一个linear SVM。
 

最新文章

  1. IE10,11下_doPostBack未定义错误的解决方法
  2. Grid – 入门必备!简单易懂的响应式设计指南
  3. JAVA NIO中的Channels和Buffers
  4. 轻松认识JVM运行时数据区域(使用思维导图)
  5. hdu2025查找最大元素
  6. django-grappelli 安装配置
  7. 结构体struct和typedef后面接指针的含义
  8. Mysql 半同步复制配置
  9. CMDB处理数据流程
  10. Python3.2官方文件翻译--课堂笔记和异常是阶级
  11. intel hex 格式的几个链接
  12. MySQL表的创建
  13. python中如何将生成等差数列和等比数列
  14. B哥竟然也被裁了,聊一聊我的看法
  15. vue_eHungry 饿了么
  16. 数据库设计,表与表的关系,一对一。One-To-One(1)
  17. [PHP] 算法-根据前序和中序遍历结果重建二叉树的PHP实现
  18. django 403问题
  19. Spark核心RDD:combineByKey函数详解
  20. HDOJ 2003 求绝对值

热门文章

  1. Lintcode---实现 Trie
  2. .NET面试题(二)
  3. unity, break prefab instance
  4. Atitit.atiJsBridge 新特性v7q329
  5. [css]margin-top重叠
  6. Entity Framework "There is already an open DataReader associated with this 的解决办法
  7. Android开发-状态栏着色原理和API版本号兼容处理
  8. iOS开发多线程篇 04 —线程间的通信
  9. CCNA2.0笔记_NAT
  10. MapReduce编程实例2