Paper: https://arxiv.org/pdf/1512.02325.pdf

SSD用神经网络(VGG)提取多层feature map ,来实现对不同大小物体的检测。如下图所示:

We use the VGG-16 network as a base, but other networks should also produce good results.

Train:

损失函数=位置误差(locatization loss, loc)+alpha*置信度误差(confidence loss, conf)

其中:

  1. 解决负样本过多的问题,仅保留损失函数最大的K个FPs,即只保留K个最像正阳本的背景。
  2. 运用Data augmentation技术,提高鲁棒性。

Detect/Predict:

  1. 对于每个预测框,根据类别置信度确定其类别(置信度最大者)与置信度值。
  2. 根据置信度阈值(如0.5)过滤掉阈值较低的预测框。
  3. 对于留下的预测框进行解码,根据先验框得到其真实的位置参数(解码后一般还需要做clip,防止预测框位置超出图片)。
  4. 解码之后,一般需要根据置信度进行降序排列,然后仅保留top-k(如400)个预测框。
  5. 最后就是进行NMS算法,过滤掉那些重叠度较大的预测框。最后剩余的预测框就是检测结果了。

本文参考了下面两篇文章:

https://zhuanlan.zhihu.com/p/33544892

https://blog.csdn.net/remanented/article/details/79943418

最新文章

  1. js禁用右键菜单、选中、复制、剪切、粘贴
  2. 使用神经网络来识别手写数字【译】(三)- 用Python代码实现
  3. sparksql---通过pyspark实现
  4. 技海拾贝 - Android
  5. (原创)android中使用相机的两种方式
  6. C# TextBox中只允许输入数字的方法
  7. Base-Android快速开发框架(四)--网络操作之FastJson以及AsyncHttpClient
  8. Android提高21篇之二:SurfaceView的基本使用方法
  9. SEOer怎样安排一天的工作
  10. LintCode-两数之和
  11. 字符串的拼接python
  12. 附录:MySQL忘记root密码
  13. shell中脚本调试----学习
  14. CentOS下Denyhosts的安装和使用
  15. PTA 7-50 畅通工程之局部最小花费问题(最小生成树Kruskal)
  16. 雷林鹏分享:C# 预处理器指令
  17. 告诉你html5比普通html多了哪些东西?
  18. 【monkeyrunner】monkeyrunner 实例
  19. .net List方法属性及作用
  20. 时间格式转换成JUN.13,2017

热门文章

  1. xhell、xftp、putty使用教程
  2. CSS 格式 设置标签间距 和 input slot
  3. C#曲线分析平台的制作(二,echarts前后台数据显示)
  4. java标识符,关键字,注释及生成Doc文档
  5. ctf每周一练
  6. Bugku-web-秋名山老司机
  7. Android面试大揭秘!从技术面被“虐”到征服CTO,全凭这份强到离谱的pdf
  8. netty系列之:文本聊天室
  9. [TensorFlow2.0]-张量与常用函数
  10. Java代码操作zookeeper