梯度直方图特征(HOG) 是一种对图像局部重叠区域的密集型描述符, 它通过计算局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。

HOG特征是一种局部区域描述符,它通过计算局部区域上的梯度方向直方图来构成人体特征,能够很好地描述人体的边缘。它对光照变化和小量的偏移不敏感。

图像中像素点(x,y)的梯度为

Dalal提出的Hog特征提取的过程:把样本图像分割为若干个像素的单元(cell),把梯度方向平均划分为9个区间(bin),在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计,得到一个9维的特征向量,每相邻的4个单元构成一个块(block),把一个块内的特征向量联起来得到36维的特征向量,用块对样本图像进行扫描,扫描步长为一个单元。最后将所有块的特征串联起来,就得到了人体的特征。例如,对于64*128的图像而言,每2*2的单元(16*16的像素)构成一个块,每个块内有4*9=36个特征,以8个像素为步长,那么,水平方向将有7个扫描窗口,垂直方向将有15个扫描窗口。也就是说,64*128的图片,总共有36*7*15=3780个特征。

在行人检测过程中,除了上面提到的HOG特征提取过程,还包括彩图转灰度,亮度校正等步骤。总结一下,在行人检测中,HOG特征计算的步骤:

(1)将输入的彩图转换为灰度图;

(2)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化);   目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;

(3)计算梯度;主要是为了捕获轮廓信息,同时进一步弱化光照的干扰。

(4)将梯度投影到单元的梯度方向;目的是为局部图像区域提供一个编码,

(5)将所有单元格在块上进行归一化;归一化能够更进一步对光照、阴影和边缘进行压缩,通常,每个单元格由多个不同的块共享,但它的归一化是基于不同块的,所以计算结果也不一样。因此,一个单元格的特征会以不同的结果多次出现在最后的向量中。我们将归一化之后的块描述符就称之为HOG描述符。

(6)收集得到检测空间所有块的HOG特征;该步骤就是将检测窗口中所有重叠的块进行HOG特征的收集,并将它们结合成最终的特征向量供分类使用。

最新文章

  1. iOS字体加载三种方式
  2. 【基础知识】UML基础
  3. Ridit分析
  4. 实现android手机来电拦截系统页面弹出自定义页面特效
  5. Java_解决java.security.cert.CertificateException: Certificates does not conform to algorithm constraints
  6. C# int.Parse()与int.TryParse()
  7. 剑指OFFER之第一个只出现一次的字符(九度OJ1283)
  8. Windows Phone中使用Storyboard做类似 IOS 屏幕小白点的效果
  9. webpack+gulp实现自动构建部署
  10. js跳转页面的几种方式
  11. amaze UI 笔记 - CSS
  12. 总结基础OOP(面向对象)
  13. JavaScript中创建对象的几种模式
  14. Visual Studio Installer 设置属性简介
  15. Redis入门指南之三(入门)
  16. linux 添加php gd扩展 (linux添加PHP扩展)
  17. android webview使用心得 屏幕宽度自适应
  18. yum与apt命令比较,yum安装出现No package vim available解决办法
  19. loli的测试——搜索
  20. 关于定位和z-index的一些小经历

热门文章

  1. aarch64_n1
  2. Oracle 11G R2 RAC中的scan ip 的用途和基本原理【转】
  3. linux编译警告 will be initialized after
  4. c语言格式控制符
  5. poj1056
  6. ZOJ 3781 Paint the Grid Reloaded(DFS连通块缩点+BFS求最短路)
  7. HDU 4283 You Are the One(区间DP(最优出栈顺序))
  8. MySQL学习笔记:concat、concat_ws、group_concat —— 字符串连接
  9. Python学习:socket.gaierror: [Errno -8]
  10. CVE-2013-3346Adobe Reader和Acrobat 内存损坏漏洞分析