Linear Discriminant Analysis Algorithm
2024-09-02 19:25:44
线性判别分析算法。
逻辑回归是一种分类算法,传统上仅限于两类分类问题。
如果有两个以上的类,那么线性判别分析算法是首选的线性分类技术。LDA的表示非常直接。它包括数据的统计属性,为每个类计算。对于单个输入变量,这包括:
- 每个类的平均值。
- 在所有类中计算的方差。
通过计算每个类的判别值并对具有最大值的类进行预测,可以做出预测。
基本计算方法:
该方法假定数据具有高斯分布(钟形曲线),因此,最好先从数据中删除异常值。这是一种简单而强大的分类预测建模问题的方法。
判别分析的典型例子是线性判别分析(Linear discriminant analysis),简称LDA。(这里注意不要和隐含狄利克雷分布(Latent Dirichlet allocation)弄混,虽然都叫LDA但说的不是一件事。)
LDA的核心思想是把高维的样本投射(project)到低维上,如果要分成两类,就投射到一维。要分三类就投射到二维平面上。这样的投射当然有很多种不同的方式,LDA投射的标准就是让同类的样本尽量靠近,而不同类的尽量分开。对于未来要预测的样本,用同样的方式投射之后就可以轻易地分辨类别了。
使用情景:
- 判别分析适用于高维数据需要降维的情况,自带降维功能使得我们能方便地观察样本分布。它的正确性有数学公式可以证明,所以同样是很经得住推敲的方式。
- 但是它的分类准确率往往不是很高,所以不是统计系的人就把它作为降维工具用吧。
- 同时注意它是假定样本成正态分布的,所以那种同心圆形的数据就不要尝试了。
更多可以参考:https://www.cnblogs.com/pinard/p/6244265.html
最新文章
- 导出Excel通用工具类
- Power BI for Office 365 概览
- [比较老的文章]三维渲染引擎 OGRE 与 OSG 的比较综述
- 使用html5的离线缓存技术
- js及jQuery实现checkbox的全选、反选和全不选
- centos6.5 apache+tomcat结合 负载均衡
- MYSQL正式环境主从复制(不锁表,不停服务)
- 设置span 宽度的完美解决方案
- iOS中 KVO 键值观察者
- How to resolve CSRF protection error while adding service through Ambari api
- Linux文件与目录管理(学习笔记)
- HDU1251 字典树板子题
- web请求过程-学习使人快乐1
- redis 作为 mysql的缓存
- Visual Studio 2015编译wxWidgets
- 在服务器上搭建node环境
- C#の----Func,Action,predicate在WPF中的应用
- arctan
- CORS &; X-Frame-Options
- hive kettle 学习笔记
热门文章
- 手撕面试官系列(五):Tomcat+Mysql+设计模式面试专题
- C语言return返回值深入理解
- 高并发 多线程批量ping工具 nbping简介和使用
- 《JAVA高并发编程详解》-类的加载过程简介
- JAVA-AbstractQueuedSynchronizer-AQS
- java之mybatis之缓存
- 在windows服务中使用定时器
- prometheus2.0 联邦的配置
- MyBatis和spring整合简单实现
- Python进阶----网络通信基础 ,OSI七层协议() ,UDP和TCP的区别 , TCP/IP协议(三次握手,四次挥手)