1.sklearn降维API:sklearn. decomposition

2.PCA是什么:主成分分析

  本质:PCA是一种分析、简化数据集的技术。

  目的:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。

  作用:可以削减回归分析或者聚类分析中特征的数量。

  当特征达到上百的时候,考虑是否要使用PCA来删除部分特征。

3.高维度数据容易出现的问题:特征之间通常是线性相关的。

4.PCA语法:

  PCA(n_components=None) 将数据分解为较低维数空间

    n_components:可以是小数,也可以是整数。为小数时,指定保存多少的数据量,通常是0.9~0.95,表示保存90%到95%的数据量。

           为整数时,表示减少到多少特征数量,一般不使用整数。

  PCA.fit_transform(X) X:numpy array格式的数据[n_samples,n_features] 返回值:转换后指定维度的array

5.PCA演示过程:

  1.初始化PCA,指定减少后的维度。

  2.调用fit_transform

案例:

def pca():
"""
主成分分析进行特征降维
:return:
"""
pca = PCA(n_components=0.9)
data = pca.fit_transform([[2, 8, 4, 5], [6, 3, 0, 8], [5, 4, 9, 1]])
print(data) if __name__ == '__main__':
# normalization()
# stand()
# im()
# var()
pca()

结果:

[[ 1.28620952e-15  3.82970843e+00]
[ 5.74456265e+00 -1.91485422e+00]
[-5.74456265e+00 -1.91485422e+00]]

6.简单的降维过程:

可以投向x轴和y轴,但是会丢失数据点,五个点变成三个点。

最新文章

  1. WPF Popup 控件导致被遮挡内容不刷新的原因
  2. iOS _C语言_1
  3. php魔术方法罗列
  4. Oracle 导入导出数据 imp/exp impdp/expdp
  5. SNAT
  6. struts2的记住账号密码的登录设计
  7. 代码创建xml文档并写入指定节点
  8. 自定义IHttpModule
  9. scala和java的区别
  10. leetcode 51. N-Queens 、52. N-Queens II
  11. 开启 Hyper-v 后如何使用 Android Emulator?
  12. aiohttp分流处理
  13. 过滤Windows文件名中的非法字符
  14. Javascript鼠标事件大全
  15. POJ 1087
  16. [咸恩静][Good Bye]
  17. 基于jQuery左右滑动切换图片代码
  18. LSTM-based Encoder-Decoder for Multi-sensor Anomaly Detection
  19. [Java][Web]Request 实现转发和 MVC 设计模式
  20. macbook pro 2016 2017 15寸 雷电3 外接显卡 epu 简单教程(不修改UEFI)

热门文章

  1. Java面试(2)
  2. 2018-10-8-Win10-使用-GHO-安装出现-UWP-软件打开闪退-应用商店无法安装软件
  3. Spark SQL设计
  4. JS事件 失焦事件(onblur)onblur事件与onfocus是相对事件,当光标离开当前获得聚焦对象的时候,触发onblur事件,同时执行被调用的程序。
  5. Caused by: android.view.InflateException: Binary XML file line #18: Binary XML file line #18: Error inflating class android.widget.CheckedTextView
  6. leetcode-157周赛-5215黄金矿工
  7. java 数组常见操作
  8. js代码触发事件
  9. 总结加密、机密jar中的class
  10. 国内外自然语言处理(NLP)研究组