yolov1, yolo v2 和yolo v3系列
2024-09-01 12:31:55
目标检测模型主要分为two-stage和one-stage, one-stage的代表主要是yolo系列和ssd。简单记录下学习yolo系列的笔记。
1 yolo V1
yolo v1是2015年的论文you only look once:unified,real-time object detection 中提出,为one-stage目标检测的开山之作。其网络架构如下:(24个卷积层和两个全连接层,注意最后一个全连接层可以理解为1*4096到1*1470(7*7*30)的线性变换)
yolo v1的理解主要在于三点:
1.1 网格划分: 输入图片为448*448,yolo将其划为为49(7*7)个cell, 每个cell只负责预测一个物体框, 如果这个物体的中心点落在了这个cell中,这个cell就负责预测这个物体
1.2 预测结果:最后网络的输出为7*7*30, 也可以看做49个1*30的向量,每个向量的组成如下: (x, y, w, h, confidence) *2 + 20; 即每一个向量预测两个bounding box及对应的置信度,还有物体属于20个分类(VOC数据集包括20分类)的概率。
1.3 Loss 函数理解:loss函数如下图所示,下面几个概念需要理清楚
s2:最后网络的输出为7*7*30, 因此49个cell;
B: 每个cell(1*30)预测了两个bbox,因此B=2,只有和ground truth具有最大IOU的bbox才参与计算
7*7的正掩膜
最新文章
- Android 热修复,插件式开发---基本知识
- 基于SURF特征的图像与视频拼接技术的研究和实现(一)
- Android(java)学习笔记61:多线程程序的引入
- dateset是不是在缓存中
- 获取客户端访问的ip地址
- 读书笔记-HBase in Action-第二部分Advanced concepts-(2)Coprocessor
- VMware workstation 10.0的永久key
- 基于ssh,shell,python,iptables,fabric,supervisor和模板文件的多服务器配置管理
- JSP知识点大致介绍1
- [转]在static代码块或static变量的初始化过程中使用ServiceManager提供的api的陷阱
- [Codeforces178F2]Representative Sampling
- sqlserver2008 T_SQL篇
- anoconda包管理汇总
- [POSIX]文件系统(概述)
- Go学习笔记(五)Go命令工具
- PIGS
- js 按指定属性给对象数组排序(json数组)
- Stochastic Optimization Techniques
- ubuntu14.4.4安装smb服务实现文件共享
- hdu-1066(大数)