一. t-tests

这一部分我们使用分布在MASS包中的UScrime数据集。它是关于美国47个州在1960年时,关于惩罚制度对犯罪率的影响。

Prob:监禁(坐牢)的概率;

U1:14到24岁的城市那你的失业率;

U2:35到39岁的城市男子的失业率;

So:an indicator variable for Southern states

1. 独立的t-test(independent t-test)

t.test(y~x,data)

t.tset(y1,y2)

例01:

> library(MASS)
> t.test(Prob~So,data=UScrime) Welch Two Sample t-test data: Prob by So
t = -3.8954, df = 24.925, p-value = 0.0006506
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.03852569 -0.01187439
sample estimates:
mean in group 0 mean in group 1
0.03851265 0.06371269

注意:可以摒弃南方的州和非南方的州有相同的犯罪率,因为p<0.01。

2.依赖的t-test

t.test(y1,y2,paired=TRUE)

·y1和y2是两个有依赖关系的组的数值向量。

例02:

> library(MASS)
> sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))
U1 U2
mean 95.46809 33.97872
sd 18.02878 8.44545
> with(UScrime,t.test(U1,U2,paired=TRUE)) Paired t-test data: U1 and U2
t = 32.4066, df = 46, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
57.67003 65.30870
sample estimates:
mean of the differences
61.48936

二. nonparametric tests of group difference

1. 比较两组

如果两组是独立的,应该使用Wilcoxon rank sum去评估自变量是否是来自相同概率分布的样本。

wilcox.test(y~x,data)

wilcox.test(y1,y2)

例03:

> with(UScrime,by(Prob,So,median))
So: 0
[1] 0.038201
--------------------------------------------------------
So: 1
[1] 0.055552
> wilcox.test(Prob~So,data=UScrime) Wilcoxon rank sum test data: Prob by So
W = 81, p-value = 8.488e-05
alternative hypothesis: true location shift is not equal to 0

例04:

> sapply(UScrime[c("U1","U2")],median)
U1 U2
92 34
> with(UScrime,wilcox.test(U1,U2,paired=TRUE)) Wilcoxon signed rank test with continuity correction data: U1 and U2
V = 1128, p-value = 2.464e-09
alternative hypothesis: true location shift is not equal to 0

2.比较多于两组

Kruskal-Wallis test:

kruskal.test(y~A,data)

·A:a grouping variable with two or more levels, if just two levels, equivalent to Mann-Whitney;

·y:a numeric outcome variable;

Friedman test:

friedman.test(y~A|B,data)

·B: a blocking variable that identifies matched observations.

npmc包中的npmc()函数:期待输入两列的数据,分别叫var(the dependent variable)和class(the grouping variable).

最新文章

  1. 两种方式实现java生成Excel
  2. Java Split以竖线作为分隔符
  3. java GUI,贷款服务器
  4. java 枚举类小结 Enum
  5. 踏着前人的脚印学Hadoop&mdash;&mdash;结构、重点
  6. 【原】 Spark中Task的提交源码解读
  7. Java基础知识强化之集合框架笔记29:使用LinkedList实现栈数据结构的集合代码(面试题)
  8. win7 32/64bit VS2010 OpenCV 2.4.9 环境配置
  9. mfc socket编程
  10. js实现浏览器添加收藏功能
  11. html打造动画【系列1】- 萌萌的大白
  12. 驱动调试-根据oops定位错误代码行
  13. Linux中使用sed命令替换字符串小结
  14. Supervisor配置
  15. 李宏毅机器学习笔记4:Brief Introduction of Deep Learning、Backpropagation(后向传播算法)
  16. 主机连接虚拟机的mysql 记录
  17. cdqz2017-test11-占卜的准备
  18. hdu2888 二维ST表(RMQ)
  19. git pull和push冲突
  20. oracle中查找锁定状态的用户

热门文章

  1. bit(比特)与Byte(字节)的区别与关系
  2. Web for pentester_writeup之Commands injection篇
  3. Web for pentester_writeup之File Include篇
  4. 暑期集训20190729 字典序(dictionary)
  5. Alibaba Java Coding Guidelines,以后的Java代码规范,就靠它了
  6. CSPS模拟 80
  7. Spark安装与学习
  8. python编程【环境篇】- 如何优雅的管理python的版本
  9. 最新JetBrains PyCharm 使用教程--下载安装Python库(五)
  10. VM 使用问题 | 安装失败-&gt;&gt;注册表