Inside-Outside Net (ION)

论文:Inside-Outside Net: Detecting Objects in Context with Skip Pooling and
Recurrent Neural Networks
发表时间:2016
发表作者:(Cornell University)Sean Bell, C. Lawrence Zitnick,(Microsoft Research)Kavita Bala, Ross Girshick
论文链接:论文链接

本文主要关注目标检测过程中的上下文信息以及多尺度信息两个方面,提出了Inside-Outside Net:
Inside Net: 采用skiping pooling的方式连接不同卷积层输出的feature map,实现多尺度特征的融合
Outside Net: 采用IRNN的结构,整合contextual infomation
在2016年提出的网络中,精度是最高的,超过Faster-RCNN\HyperNet\MRCNN.

  • VOC2007, with a mAP of 79.2%,
  • VOC 2012, with a mAP of 76.4%,
  • COCO, with a mAP of 24.9%.

框架

ION整体框架

采用的是Fast RCNN的基本框架(VGG),通过SS和EB提取Proposal,对于每一个ROI,提取conv3/conv4/conv5对应的特征,fix到固定的长度;
然后将conv5输出的feature map输入到两个IRNN单元提取上下文信息。同样,在输出的context feature map上提取ROI对应的特征,fix到固定长度。
然后将multi-scale特征和context特征先normalize/scale(不同feature map激活值不一样,会导致unstable learning),然后concate到一起。通过1*1卷积进行降维。输出到分类器去进行cls和reg.

spatial Recurrent Neural Network (RNNs)

RNNs在每一层空间上,通过水平或者垂直的四个方向进行提取上下文信息。使用两个RNNs,保证可以获取整张image的信息。
对比其他common methods for adding contextual information: 还有 global average pooling 和 additional convolutional layers,都很相似。

skip pooling

将multi-scale的feature maps经过roi-pooling layer之后pooling到7x7大小的feature maps,将从不同scale pooled得到的feature maps进行concatenate,然后再利用 1x1Conv layer将feature maps resize到512x7x7的大小。

context features with IRNNs

对于一个feature maps,有四个独立的RNN对其进行上下左右四个方向的移动。

ION2

总结:
(1)paper 使用了multi-scale 进行object detection,在浅层Conv层对其feature maps进行roi-pooling, 增强了对small object的detect能力。
(2)使用了RNN对其周围的region的信息,增强feature信息,促进classification。

最新文章

  1. SAX解析DOM4J的方法总结
  2. IO-01. 表格输出(5)
  3. To be transfered
  4. memcached 安装
  5. 重温delphi之控制台程序:Hello World!
  6. Javaweb项目开发的前后端解耦的必要性
  7. 【天坑】ASP.net WebAPI跨域调用问题
  8. 利用生产者消费者模型和MQ模型写一个自己的日志系统-并发设计里一定会用到的手段
  9. 八大排序算法——归并排序(动图演示 思路分析 实例代码java 复杂度分析)
  10. 前端自动化构建工具 gulp 学习笔记 一、
  11. MySQL 性能调优之索引
  12. 【1】Java中double转BigDecimal的注意事项
  13. hibernate框架学习之核心API
  14. Linux基础命令---lpc打印机控制
  15. linux samba smb 在客户端无法连接使用
  16. http请求的基本介绍
  17. flask框架----flask-session组件
  18. 使用vue+webpack打包时,去掉资源前缀
  19. sublime text配置fcitx输入法
  20. 09python之运算

热门文章

  1. php iconv实现编码转换
  2. C语言获取当前系统时间
  3. mysql常用操作及常见问题
  4. Redis 5.0.5 Install manual
  5. 【LOJ】#2210. 「HNOI2014」江南乐
  6. 【k8s第三步】Kubernetes-Dashboard仪表盘【已修正错误】
  7. 关于 磁盘 I/O 的工作机制那些事
  8. js 根据 数组条件 简单查询的方法临时保存
  9. mysql存储emoji表情报错的处理方法【更改编码为utf8mb4】
  10. (九) spring 使用自定义限定符注解