背景

上一讲从对偶问题的角度描述了SVM问题,但是始终需要计算原始数据feature转换后的数据。这一讲,通过一个kernel(核函数)技巧,可以省去feature转换计算,但是仍然可以利用feature转换的特性。

 

什么是kernel

Kernel的其实就是将向量feature转换与点积运算合并后的运算,如下,

概念上很简单,但是并不是所有的feature转换函数都有kernel的特性。

 

Kernel化的SVM

在对偶化的SVM解中,有三个地方会使用到kernel

  • 计算截距b
  • 计算QP中的Q矩阵
  • 预测分类

使用了kernel,w的具体值都无需计算,因为没有地方会直接使用w。这也是为什么上一讲花了那么大的精力描述对偶化的SVM解。

 

常见kernel

常见kernel有多项式,高斯和线性,各有利弊。

 

线性kernel

不做feature转换,直接使用。不需要使用对偶技巧,直接使用linear hard SVM解。

优点:计算效率高;结果解释性好。

缺点:需要数据线性可分

 

多项kernel

对x进行多项式展开,一般的形式为

其中a,b,Q为常量。

优点:相比线性kernel,对数据要求没有那么严格

缺点:需要选择的系数较多;Q太大会超出一些计算机的精度,一般Q<=3。

 

高斯Kernel

有些资料也称为RBF(Radial Base Function),一般形式为

其中a(>0)是常量。高斯kernel厉害的地方是可以将原始数据x映射到无线维度空间中,x下面取a=1的例子

上面的变化采用了Taylor展开,接着

其中特征转化为

这样,就完成了向无线维度转换,RBF是不是很厉害!

优点:调试的系数较少;比线性和多项式更强大,几乎可以适应所有数据;不容易出现计算精度问题

缺点:无线维度无法解释;太强大,容易过拟合;计算开销大。

 

总结

个人感觉,核函数是SVM画龙点睛之笔,真的很佩服发现kernel的科学家。在实际使用SVM的过程中,很大一部分精力可能就是选择kernel和相关系数。Kernel还可以自定义,但是需要满足一些条件,具体可以参考讲义相关部分。

最新文章

  1. linux命令每日一练习 解压命令
  2. Codeforces 549C. The Game Of Parity[博弈论]
  3. 如何给我们的eclipse新建文件自动生成注释
  4. vsfptd
  5. Independence独立
  6. 初识sass
  7. css3 文本记
  8. 图论(网络流,分数规划):COGS 2047. [ZOJ2676]网络战争
  9. CSS样式----CSS的继承性和层叠性(图文详解)
  10. redis—操作基础
  11. 637. Average of Levels in Binary Tree
  12. [C#][Newtonsoft.Json] Newtonsoft.Json 序列化时的一些其它用法
  13. (转)Unity控制反转和依赖注入
  14. Kettle使用MySQL作为资源库报错解决方法
  15. 下载中间件--随机IP代理以及随机User_Agent
  16. HL7消息部分笔记
  17. svn和NetBeans一起使用造成svn老是死锁, database is locked
  18. MVC _Ajax的使用【七】
  19. c++两个类相互调用
  20. C#基础 常用语&amp;数据类型定义&amp;类型转换

热门文章

  1. vim基础使用
  2. 数据库的char(n)
  3. JS实现滑动门效果
  4. 用C语言写的双色球
  5. 奇葩问题之ToolBar返回键失效
  6. 解决VMware下安装Ubuntu15不支持1920X1080分辨率的问题
  7. 修改Broforce无限人数,死亡不减反加
  8. [原] XAF 如何基于业务规则禁用属性
  9. OkHttp使用进阶 译自OkHttp Github官方教程
  10. PostgreSQL学习记录-- 2016-03-11