原文地址

我对深度学习应用于物体检测的开山之作R-CNN的论文进行了主要部分的翻译工作,R-CNN通过引入CNN让物体检测的性能水平上升了一个档次,但该文的想法比较自然原始,估计作者在写作的过程中已经意识到这个问题,所以文中也对未来的改进提出了些许的想法,未来我将继续翻译SPPNet、fast-RCNN、faster-RCNN、mask-RCNN等一系列物体定位和语义分割领域的重要论文,主要作者都是Ross Girshick和Kaiming He。

用于精确物体定位和语义分割的丰富特征层次结构

Rich feature hierarchies for accurate object detection and semantic segmentation

Ross Girshick      Jeff Donahue      Trevor Darrell     Jitendra Malik
UC Berkeley

摘要

过去几年,在权威的PASCAL VOC数据集上,物体定位的性能已经达到一个稳定水平。表现最好的方法都是融合了多个低层次图像特征和高层次的上下文环境的复杂系统。本文提出一种简单的可扩展的检测算法,可以将VOC2012上期望平均精度的最好结果明显提升30%以上——达到了53.3%。我们的方法结合了两个关键因素:(1) 将大型卷积神经网络(CNNs)应用于自底向上区域推荐以定位和分割物体;(2)当标签训练数据不足时,先针对辅助任务进行有监督预训练,再进行特定任务的调优,就可以产生明显的性能提升。由于我们结合了区域推荐和CNNs,该方法被称为R-CNN:Regions with CNN features。我们对比了R-CNN和OverFeat,Overfeat是最近被提出的一个机遇类CNN架构的滑动窗口检测器,发现R-CNN在ILSVRC2013检测数据集上面的表现明显优于OverFeat。整个系统的源码在:https://people.eecs.berkeley.edu/~rbg/rcnn(译者注:已失效,新地址:https://github.com/rbgirshick/rcnn)。
 

最新文章

  1. MVC 数据验证
  2. [LeetCode] Find All Numbers Disappeared in an Array 找出数组中所有消失的数字
  3. LightOJ1171 Knights in Chessboard (II)(二分图最大点独立集)
  4. 优化Webstorm
  5. x264测试代码
  6. 解决 aspx 页面 TextBox 不支持 type="number"
  7. lua进阶(一)
  8. 《Java程序员面试笔试宝典》之Java与C/C++有什么异同
  9. Servlet入门和ServletConfig、ServletContext
  10. 转:Apache 与 Nginx 比较
  11. cmd中添加snmpd被控
  12. Openstack & Ansible
  13. Vue应用请求SpringBoot API出现 CORS 跨域请求设置 Invalid CORS request错误
  14. Golang 入门系列(十) mysql数据库的使用
  15. 《深度探索C++对象模型》读书笔记(二)
  16. switch语句和switch-case与if-else之间的转换
  17. 说一下acad的bug及问题
  18. Windows自动执行java脚本
  19. (二分匹配“匈牙利算法”)无题II --HDU --2236
  20. wcf服务查看工具

热门文章

  1. ssh (免密码登录、开启服务)
  2. windows下怎么解决Python双版本问题
  3. ajax url参数中文乱码解决方法
  4. Android ListView getViewTypeCount 的返回值问题解决
  5. 解决Android5.0以下Dialog引起的内存泄漏
  6. JQuery上传插件Uploadify详解及其中文按钮解决方案 .
  7. Ubuntu16.04下Office替代品Office Online
  8. win10 uwp 右击浮出窗在点击位置
  9. linux系统下Python虚拟环境的安装和使用
  10. JavaWeb之Maven配置