Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
2024-10-20 18:54:41
将 RCN 中下面 3 个独立模块整合在一起,减少计算量:
CNN:提取图像特征
SVM:目标分类识别
Regression 模型:定位
不对每个候选区域独立通过 CN 提取特征,将整个图像通过 CNN 提取特征,然后从 CNN 的特征图中根据 Selection Search 的候选区域通过 Rol Pooling 层提取区域特征
Faster R-CNN训练步骤:
预训练一个用于分类的CNN
使用CNN的特征图作为输出,端到端的fine-tune RPN(region proposal network)+CNN. 当ioU>0.7为正样本,ioU《0.3为负样本
- 在特征图上面使用滑动窗口
- 对每一个滑动窗口,产生多个Anchor(相当于Selective Search选中的候选区域).一个Anchor由滑动窗口的中心位置,窗口尺寸,窗口宽高比决定.论文中使用3个尺寸和3个宽高比,所以一个滑动窗口位置对应9(3*3)个Anchor
固定RPN的权值,使用氮气啊的RPN训练一个Fast R-CNN
固定CNN,Fast R-CNN的权值,训练RPN
固定CNN, RPN,训练Fast R-CNN的权值
重复步骤4和5知道满意为止
Faster R-CNN可以简单地看做“区域生成网络RPNs + Fast R-CNN”的系统,用区域生成网络代替FastR-CNN中的Selective Search方法。Faster R-CNN这篇论文着重解决了这个系统中的三个问题:
- 如何设计区域生成网络;
- 如何训练区域生成网络;
- 如何让区域生成网络和Fast RCNN网络共享特征提取网络。
在整个Faster R-CNN算法中,有三种尺度:
原图尺度:原始输入的大小。不受任何限制,不影响性能。
- 归一化尺度:输入特征提取网络的大小,在测试时设置,源码中opts.test_scale=600。anchor在这个尺度上设定。这个参数和anchor的相对大小决定了想要检测的目标范围。
网络输入尺度:输入特征检测网络的大小,在训练时设置,源码中为224*224。
参考
https://blog.csdn.net/sinat_26745777/article/details/104956858
最新文章
- WebApi防重复提交方案
- MySQL数据库数据存放位置修改
- Zxing库
- 有关数据库行、锁 的几个问题(rowlock)
- MySQL与MongoDB的操作对比,以及区别
- ajax:post 400错误
- nylg 640 Geometric Sum
- Postman使用小技巧 - 用Postman生成Request代码
- (剑指Offer)面试题27:二叉搜索树与双向链表
- Cracking the coding interview--Q2.1
- 阿里react整合库dva demo分析
- Python----Windows环境下安装Flask
- spider爬虫练习
- Django--models--多表操作
- JVM 基础:回收哪些内存/对象 引用计数算法 可达性分析算法 finalize()方法 HotSpot实现分析
- (转)fabric 一个链码如何调用另一个链码
- 生产BackPressure 的代码
- SDUTOJ2465:其实玩游戏也得学程序(bfs+优先队列+回溯)
- .NET Core2.0应用IdentityServer4
- 慕课网笔记之oracle开发利器-PL/SQL基础
热门文章
- Android开发之《RXJava的简单实现》
- 吴裕雄--天生自然python学习笔记:Python3 输入和输出
- Pandas写excel总结:写入多个sheet、1个sheet写入多行、向已有sheet追加数据
- 6.8.5 使用Lambda表达式调用Arrays的类方法
- angular知识点(2)
- 新财报再次巨亏 HTC还能活到2017吗?
- Welcome to Giyber Blog - LC的博客
- HTTP Continuation or non-HTTP traffic
- ES6学习笔记(三):教你用js面向对象思维来实现 tab栏增删改查功能
- Centos 7 使用Securecrt 配置Public key 登录