【转】【机器学习】R 正则化函数 scale
2024-08-28 13:52:19
源:http://blog.163.com/shen_960124/blog/static/60730984201582594011277/
1. 数据的中心化
所谓数据的中心化是指数据集中的各项数据减去数据集的均值。
例如有数据集1, 2, 3, 6, 3,其均值为3,那么中心化之后的数据集为1-3,2-3,3-3,6-3,3-3,即:-2,-1,0,3,0
2.数据的标准化
所谓数据的标准化是指中心化之后的数据在除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。
例如有数据集1, 2, 3, 6, 3,其均值为3,其标准差为1.87,那么标准化之后的数据集为(1-3)/1.87,(2-3)/1.87,(3-3)/1.87,(6-3)/1.87,(3-3)/1.87,即:-1.069,-0.535,0,1.604,0
数据中心化和标准化的意义是一样的,为了消除量纲对数据结构的影响。
在R语言中可以使用scale方法来对数据进行中心化和标准化:
scale方法中的两个参数center和scale的解释:
1.center和scale默认为真,即T或者TRUE
2.center为真表示数据中心化
3.scale为真表示数据标准化
#限定输出小数点后数字的位数为3位
options(digits=3)
data <- c(1, 2, 3, 6, 3) #数据中心化
scale(data, center=T, scale=F)
[,1] [1,] -2 [2,] -1 [3,] 0 [4,] 3 [5,] 0 attr(,"scaled:center") [1] 3 #数据标准化 > scale(data, center=T,scale=T) [,1] [1,] -1.06904 [2,] -0.53452 [3,] 0.00000 [4,] 1.60357 [5,] 0.00000 attr(,"scaled:center") [1] 3 attr(,"scaled:scale") [1] 1.8708
最新文章
- Put-Me-Down项目Postmortem2
- [转]如何:在设备上安装 SQL Server Compact 3.5
- C++中string 的使用
- Qt树形控件QTreeView使用1——节点的添加删除操作 复选框的设置
- div+css知识点
- C++ Primer 5th 第15章 面向对象程序设计
- [置顶] Objective-C ,ios,iphone开发基础:ios数据库(The SQLite Database),使用终端进行简单的数据库操作
- JAVA学习课第五 — IO流程(九)文件分割器合成器
- Laravel 安装
- [Day03] 循环语句、list相关练习题
- [Codeforces 946D]Timetable
- python借助ADB工具实现自动化操作手机
- 自制操作系统Antz(7)——实现内核 (上)
- 传参导出Excel表乱码问题解决方法
- Python机器学习笔记——随机森林算法
- php判断手机是安卓系统还是ios系统
- H5 69-清除浮动方式四
- qhfl-3 Course模块
- 第14月第17天 automaticallyAdjustsScrollViewInsets contentInsetAdjustmentBehavior
- 检查是否使用PAM认证模块禁止wheel组之外的用户su为root
热门文章
- ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction解决办法
- 纠结了一下午的问题:运行opencv的HoughLinesP函数出错
- mac电脑复制键失灵
- leetcode1035
- [HTML]音乐自动播放(兼容微信)
- Ubuntu16.04 导入tensorflow报错
- 5.LNMP(Linux + Nginx + MySQL + PHP)环境安装
- 查询Oracle版本
- 虚拟机中安装完Lunix系统后,开机黑屏,只显示一个-,解决方法
- spring boot 2 统一异常处理