Chapter 07-Basic statistics(Part4 t-tests&&nonparametric tests of group difference)
一. t-tests
这一部分我们使用分布在MASS包中的UScrime数据集。它是关于美国47个州在1960年时,关于惩罚制度对犯罪率的影响。
Prob:监禁(坐牢)的概率;
U1:14到24岁的城市那你的失业率;
U2:35到39岁的城市男子的失业率;
So:an indicator variable for Southern states
1. 独立的t-test(independent t-test)
t.test(y~x,data)
t.tset(y1,y2)
例01:
> library(MASS)
> t.test(Prob~So,data=UScrime) Welch Two Sample t-test data: Prob by So
t = -3.8954, df = 24.925, p-value = 0.0006506
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.03852569 -0.01187439
sample estimates:
mean in group 0 mean in group 1
0.03851265 0.06371269
注意:可以摒弃南方的州和非南方的州有相同的犯罪率,因为p<0.01。
2.依赖的t-test
t.test(y1,y2,paired=TRUE)
·y1和y2是两个有依赖关系的组的数值向量。
例02:
> library(MASS)
> sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))
U1 U2
mean 95.46809 33.97872
sd 18.02878 8.44545
> with(UScrime,t.test(U1,U2,paired=TRUE)) Paired t-test data: U1 and U2
t = 32.4066, df = 46, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
57.67003 65.30870
sample estimates:
mean of the differences
61.48936
二. nonparametric tests of group difference
1. 比较两组
如果两组是独立的,应该使用Wilcoxon rank sum去评估自变量是否是来自相同概率分布的样本。
wilcox.test(y~x,data)
wilcox.test(y1,y2)
例03:
> with(UScrime,by(Prob,So,median))
So: 0
[1] 0.038201
--------------------------------------------------------
So: 1
[1] 0.055552
> wilcox.test(Prob~So,data=UScrime) Wilcoxon rank sum test data: Prob by So
W = 81, p-value = 8.488e-05
alternative hypothesis: true location shift is not equal to 0
例04:
> sapply(UScrime[c("U1","U2")],median)
U1 U2
92 34
> with(UScrime,wilcox.test(U1,U2,paired=TRUE)) Wilcoxon signed rank test with continuity correction data: U1 and U2
V = 1128, p-value = 2.464e-09
alternative hypothesis: true location shift is not equal to 0
2.比较多于两组
Kruskal-Wallis test:
kruskal.test(y~A,data)
·A:a grouping variable with two or more levels, if just two levels, equivalent to Mann-Whitney;
·y:a numeric outcome variable;
Friedman test:
friedman.test(y~A|B,data)
·B: a blocking variable that identifies matched observations.
npmc包中的npmc()函数:期待输入两列的数据,分别叫var(the dependent variable)和class(the grouping variable).
最新文章
- 两种方式实现java生成Excel
- Java Split以竖线作为分隔符
- java GUI,贷款服务器
- java 枚举类小结 Enum
- 踏着前人的脚印学Hadoop&mdash;&mdash;结构、重点
- 【原】 Spark中Task的提交源码解读
- Java基础知识强化之集合框架笔记29:使用LinkedList实现栈数据结构的集合代码(面试题)
- win7 32/64bit VS2010 OpenCV 2.4.9 环境配置
- mfc socket编程
- js实现浏览器添加收藏功能
- html打造动画【系列1】- 萌萌的大白
- 驱动调试-根据oops定位错误代码行
- Linux中使用sed命令替换字符串小结
- Supervisor配置
- 李宏毅机器学习笔记4:Brief Introduction of Deep Learning、Backpropagation(后向传播算法)
- 主机连接虚拟机的mysql 记录
- cdqz2017-test11-占卜的准备
- hdu2888 二维ST表(RMQ)
- git pull和push冲突
- oracle中查找锁定状态的用户
热门文章
- bit(比特)与Byte(字节)的区别与关系
- Web for pentester_writeup之Commands injection篇
- Web for pentester_writeup之File Include篇
- 暑期集训20190729 字典序(dictionary)
- Alibaba Java Coding Guidelines,以后的Java代码规范,就靠它了
- CSPS模拟 80
- Spark安装与学习
- python编程【环境篇】- 如何优雅的管理python的版本
- 最新JetBrains PyCharm 使用教程--下载安装Python库(五)
- VM 使用问题 | 安装失败->;>;注册表