源:http://blog.163.com/shen_960124/blog/static/60730984201582594011277/

1. 数据的中心化

所谓数据的中心化是指数据集中的各项数据减去数据集的均值。

例如有数据集1, 2, 3, 6, 3,其均值为3,那么中心化之后的数据集为1-3,2-3,3-3,6-3,3-3,即:-2,-1,0,3,0

2.数据的标准化

所谓数据的标准化是指中心化之后的数据在除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。

例如有数据集1, 2, 3, 6, 3,其均值为3,其标准差为1.87,那么标准化之后的数据集为(1-3)/1.87,(2-3)/1.87,(3-3)/1.87,(6-3)/1.87,(3-3)/1.87,即:-1.069,-0.535,0,1.604,0

数据中心化和标准化的意义是一样的,为了消除量纲对数据结构的影响。

在R语言中可以使用scale方法来对数据进行中心化和标准化:

scale方法中的两个参数center和scale的解释:

1.center和scale默认为真,即T或者TRUE

2.center为真表示数据中心化

3.scale为真表示数据标准化

#限定输出小数点后数字的位数为3位
options(digits=3)
data <- c(1, 2, 3, 6, 3) #数据中心化
scale(data, center=T, scale=F)
[,1] [1,] -2 [2,] -1 [3,] 0 [4,] 3 [5,] 0 attr(,"scaled:center") [1] 3 #数据标准化 > scale(data, center=T,scale=T) [,1] [1,] -1.06904 [2,] -0.53452 [3,] 0.00000 [4,] 1.60357 [5,] 0.00000 attr(,"scaled:center") [1] 3 attr(,"scaled:scale") [1] 1.8708

  

最新文章

  1. Put-Me-Down项目Postmortem2
  2. [转]如何:在设备上安装 SQL Server Compact 3.5
  3. C++中string 的使用
  4. Qt树形控件QTreeView使用1——节点的添加删除操作 复选框的设置
  5. div+css知识点
  6. C++ Primer 5th 第15章 面向对象程序设计
  7. [置顶] Objective-C ,ios,iphone开发基础:ios数据库(The SQLite Database),使用终端进行简单的数据库操作
  8. JAVA学习课第五 — IO流程(九)文件分割器合成器
  9. Laravel 安装
  10. [Day03] 循环语句、list相关练习题
  11. [Codeforces 946D]Timetable
  12. python借助ADB工具实现自动化操作手机
  13. 自制操作系统Antz(7)——实现内核 (上)
  14. 传参导出Excel表乱码问题解决方法
  15. Python机器学习笔记——随机森林算法
  16. php判断手机是安卓系统还是ios系统
  17. H5 69-清除浮动方式四
  18. qhfl-3 Course模块
  19. 第14月第17天 automaticallyAdjustsScrollViewInsets contentInsetAdjustmentBehavior
  20. 检查是否使用PAM认证模块禁止wheel组之外的用户su为root

热门文章

  1. ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction解决办法
  2. 纠结了一下午的问题:运行opencv的HoughLinesP函数出错
  3. mac电脑复制键失灵
  4. leetcode1035
  5. [HTML]音乐自动播放(兼容微信)
  6. Ubuntu16.04 导入tensorflow报错
  7. 5.LNMP(Linux + Nginx + MySQL + PHP)环境安装
  8. 查询Oracle版本
  9. 虚拟机中安装完Lunix系统后,开机黑屏,只显示一个-,解决方法
  10. spring boot 2 统一异常处理