推荐:http://www.cnblogs.com/tornadomeet/archive/2012/08/17/2644903.html

SURF-Speeded Up Robust Features

是对SIFT的增强

与SIFT的不同之处:

1.DoH近似-Determinant of Hessian

也就是使用每个像素Hessian矩阵的行列式的近似值构成!

而SIFT使用原图构造的DoG图来寻找关键点!

2.高斯模糊

SIFT与SURF都要首先对原图像进行高斯模糊来构造尺度空间:

SIFT构造的金字塔  是每组octave之间的图像大小不相同,且每组octave里各层图像高斯模糊时使用的sigma不同(下一组第一张与上一组倒数第三张相差k倍,取为连续)。

尺度空间的分组时,相邻组首尺度滤波器大小之差相差2倍。如第一二组差6,则二三组差12.为了减少计算时间,第一组采样间隔1像素,第二组2像素,以此倍增。

SURF构造的金字塔 是每组octave之间的图像大小相同,且每组octave里各层搞死模糊时使用的模板尺寸不一样,如第一组,第一个滤波器模板大小是9*9,其中9=(l0)^2,l0=3;

那么第一组,第二个是15*15,其中15=(l0)^2,l0=5=上一个l0+2;

以此类推,第一组里。。9*9,15*15,21*21,27*27

那么在第二组里是15*15,27*27,39*39,51*51

 3.方向选取

SIFT就是使用HOG方向梯度直方图来找主方向与辅助方向。

SURF是使用Haar小波变换来求取主方向(待补充)。。。即在特征点的领域(比如说,半径为6s的圆内,s为该点所在的尺度)内,统计60度扇形内所有点的水平haar小波特征和垂直haar小波特征总和,haar小波的尺寸变长为4s,这样一个扇形得到了一个值。然后60度扇形以一定间隔进行旋转,最后将最大值那个扇形的方向作为该特征点的主方向。

4.构造特征点描述算子

   在sift中,是在特征点周围取16*16的邻域,并把该领域化为4*4个的小区域,每个小区域统计8个方向梯度,最后得到4*4*8=128维的向量,该向量作为该点的sift描述子。

在surf中,也是在特征点周围取一个正方形框,框的边长为20s(s是所检测到该特征点所在的尺度)。该框带方向,方向当然就是第4步检测出来的主方向了。然后把该框分为16个子区域,每个子区域统计25个像素的水平方向和    垂直方向的haar小波特征,这里的水平和垂直方向都是相对主方向而言的。该haar小波特征为水平方向值之和,水平方向绝对值之和,垂直方向之和,垂直方向绝对值之和。

这样每个小区域就有4个值,所以每个特征点就是16*4=64维的向量,相比sift而言,少了一半,这在特征匹配过程中会大大加快匹配速度。

最新文章

  1. Oracle索引梳理系列(八)- 索引扫描类型及分析(高效索引必备知识)
  2. js 中关于this用变量存起来的原因
  3. flask笔记1-安装
  4. iOS架构基础
  5. 解析for循环
  6. 为什么在Mac中无法用k web运行ASP.NET 5程序
  7. linux命令行快捷键
  8. Java免费开源数据库、Java嵌入式数据库、Java内存数据库
  9. 百度UEditor开发案例(JSP)
  10. JVM分代垃圾回收策略的基础概念
  11. [转]laravel 4之视图及Responses
  12. GNOME界面简单使用
  13. Windows Phone开发(16):样式和控件模板
  14. python :ascii codec can't decode byte 0xe8 in posit
  15. 小程序从后台输出的代码为HTML实体字符如何解决?
  16. .net自定义错误页面实现升级篇
  17. TOTP 介绍及基于C#的简单实现
  18. eclipse上的.properties文件中文编辑显示问题
  19. 通过Spark Streaming的foreachRDD把处理后的数据写入外部存储系统中
  20. JQuery UI之Autocomplete(3)属性与事件

热门文章

  1. python center, ljust, rjust
  2. iOS 修改UITextField的placeholder属性的字体颜色(修改UITextField占位符字体的颜色)
  3. Linux下原子性操作,类似Windows下的InterLockedXXX
  4. tableview head
  5. mysql 查看是否存在某一张表
  6. Leetcode: Kth Smallest Element in a Sorted Matrix
  7. 3D照片放大展示窗口
  8. TTabControl、TMemo组件(制作一个简单的多文本编辑框)
  9. POJ 3243 Clever Y(离散对数-拓展小步大步算法)
  10. 夺命雷公狗---2016-linux---2之软件实现远程登录