经典相关分析,典型关分析, CCA,Canonical Correlation Analysis,多元变量分析,线性组合,相关系数最大化
2024-08-27 04:51:59
1.从概率论中相关系数推广而来
在概率论中,研究两个变量之间的线性相关情况时,提出了 相关系数 这个概念。做一下推广,如果研究一个变量和多个随机变量之间的线性相关关系时,提出了 全相关系数(或者复相关系数)的概念。然后,在1936年,有个叫做hotelling的数学家,又进一步做了推广,研究 多个随机变量和多个随机变量之间的线性相关关系,提出了 经典相关分析 的理论。
2.经典相关分析的定义
经典相关分析是研究两组变量相关关系的一种多元统计方法。
要研究两组变量:和之间的相关关系,有两种方法:一、列出一张表,就像研究协方差矩阵一样,这张表中包含两组变量任意两个变量之间的相关关系。然后,就基于这张相关系数表进行分析。二、像主成份分析pca一样,在每一组变量中,都选取若干综合指标,这些综合指标是由变量线性组合而成。通过研究两组综合指标之间的关系来研究变量之间的线性关系。
3.具体步骤
寻求每一组变量的线性组合,然后两组变量的线性组合之间具有最大相关性。这中组合不唯一,而且也可能把变量的所有特征全部涵盖。
继续寻求寻求每一组变量的线性组合,而这一次则要求两组变量的线性组合之间具有最大相关性,而且要与第一次找到的组合不相干。也就是具有一种类似于正交的关系。
典型相关分析,为什么叫作典型。每一组变量的线性组合得到的新变量,X和Y 称之为典型变量。
4.具体计算过程,如下:贴大图
5. cca的其余解释版本 参考:http://blog.csdn.net/statdm/article/details/7585113
最新文章
- BZOJ 2127: happiness [最小割]
- Selenium FF WebDriver 加载firebug 和设置代理
- 配置nginx支持ssl服务器—HTTPS
- 使用poi读取xlsx中的数据
- yii2超好用的日期组件和时间组件
- LeetCode----67. Add Binary(java)
- Codeforces Round #312 (Div. 2) A. Lala Land and Apple Trees 暴力
- 程序模拟浏览器请求及会话保持-python实现
- PHP - 传入WebService服务端带中文字符的序列化字串不能反序列化的解决方法
- WPF的进度条progressbar,运行时间elapse time和等待spinner的实现
- 移动跨平台开发框架Ionic开发一个新闻阅读APP
- Linux C语言写的超级简单port扫描器
- PAT (Advanced Level) 1067. Sort with Swap(0,*) (25)
- SRM340 VegetableGarden
- elementUI vue tree input 懒加载 输入下拉树型示例 点击其他区域关闭自定义div
- 人群密度估计 CrowdCount
- 浏览器执行代码 是jsp 服务端执行的是<;%%>;
- glog学习(一):glog的编译及demo
- 《Maven实战》笔记
- oracle查询重复数据方法