R语言实战读书笔记(二)创建数据集
2.2.2 矩阵
matrix(vector,nrow,ncol,byrow,dimnames,char_vector_rownames,char_vector_colnames)
其中:
byrow=TRUE/FALSE,表示按行填充还是按列填充,默认情况下是按列填充
2.2.4 数据框
1.attach,detach()和with()
attach():将数据框加入搜索路径
detach():将数据框移除出搜索路径
with():赋值仅在括号内有效,如果想在括号外生效也可以,用<<-
2.2.5 因子
因子:名义型变量和有序型变量,会将此类变量都对应一个整数值
factor():生成因子向量,ordered=TRUE后为有序变量,levels参数是覆盖默认排序,可以指定有序变量对应整数值的顺序
用法:
patientID <- c(1, 2, 3, 4)
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
diabetes <- factor(diabetes) #会被编成1 2 1 1
status <- factor(status, order = TRUE) #会被编成3 2 1 3
patientdata <- data.frame(patientID, age, diabetes, status)
str(patientdata) #str是显示对象结构,可以展示出来被编码成什么
summary(patientdata)
2.2.6 列表
g <- "My First List"
h <- c(25, 26, 18, 39)
j <- matrix(1:10, nrow = 5)
k <- c("one", "two", "three")
mylist <- list(title = g, ages = h, j, k)
mylist
2.3.2 从带分隔符的文本文件导入数据
read.table(file,header,sep,row.nanes),默认情况下,字符型变量都将转换为因子,可以设置stringsAsFactors=FALSE
2.5 处理数据对象的实用函数,看完了机器学习实战觉得这些都是小儿科了
length()
dim():显示对象的维度
str():显示对象的结构,R语言这个坑死的命名啊,str不是一般指string吗,这样就变成了structure
class()
names()
cbind()
rbind()
head()
tail()
最新文章
- 日常关键字:定时关机、该任务映像已损坏或已篡改.(0x80041321)、ChaZD生词同步扇贝
- enumerate用法
- Centos screen远程会话管理命令
- MFC双缓冲绘图(2015.09.24)
- 【python】利用pathlib遍历目录Path().rglob
- WampServe修改默认网站目录的方法(转)
- php插入排序
- 腾讯QQ群数据下载方法(7000万个qq群资料全泄漏)
- MSSQLServer基础02(SQL语句入门(脚本、命令))
- python 下的数据结构与算法---7:查找
- kafka第六篇---多个进程读不齐
- RabbitMQ通过Exchange.headers属性代替routekey,x-match实现队列精准匹配
- byteify
- Yii Framework隐藏index.php文件的步骤
- A - Playground
- (转)WebSphere的web工程中怎么获取数据源
- MonkeyRunner进坑——errors importing other modules
- vue 里面的watch 选项详解
- SVN、TortoiseSVN相关问题
- 基于nginx-rtmp-module模块实现的HTTP-FLV直播模块(nginx-http-flv-module)