为什么样本方差自由度(分母)为n-1
一、概念、条件及目的
1.概念
要理解样本方差的自由度为什么是n-1,得先理解自由度的概念:
自由度,是指附加给独立的观测值的约束或限制的个数,即一组数据中可以自由取值的个数。
2.成立条件
所谓自由取值,是指抽样时选取样本,也就是说:只有当以样本的统计量来估计总体的参数时才有自由度的概念,直接统计总体参数时是没有自由度概念的。
3.目的
自由度概念,是为了在通过样本进行参数估计时,剔除系统误差,实现无偏估计。
设A'=g(X1,X2,...,Xn)是未知参数A的一个点估计量,若A'满足E(A')= A ,则称A'为A的无偏估计量,否则为有偏估计量。所以,无偏估计就是系统误差为零的估计。
如果看完以上释义仍觉得有些晦涩难懂,可以阅读下知乎上生动的解说,查看排第一的回答即可,附上链接:
https://www.zhihu.com/question/22983179
二、详解自由度
当样本数据的个数为n时,若样本平均数 x拔 确定后,则附加给n个观测值的约束个数就是1个,一次只有n-1个数据可以自由取值,其中必有一个数据不能自由取值。按照这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。例如假设样本有3个值,即x1=2,x2=4,x3=9,则当 x拔 =5确定后,x1、x2、x3只有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3必然取2,而不能取其他值。
样本方差自由度为什么为n-1呢,因为在计算离差平方和 ∑(xi -x)2 时,必须先求出样本平均数 x拔,而 x拔 则是附加给 ∑(xi -x)2 的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个。
三、公式推导
有兴趣的,可以参考果壳网的博文,附上链接
http://www.guokr.com/question/468100/
最新文章
- SDWebImage的使用
- [原] VS新添加WebApplication项目,无法运行,请求帮助,问题如何解决
- Linux Process Management &;&; Process Scheduling Principle
- 团队项目—编写项目的Spec
- 算法训练 Torry的困惑
- 一网打尽当下NoSQL类型、适用场景及使用公司
- Machine Learning - 第3周(Logistic Regression、Regularization)
- WCF客户端和服务端配置
- JS-中对表单处理
- phpmyadmin修改mysql数据库密码
- Java中的框架基础面试知识
- SSH端口转发详解及实例
- 安装Ruby、Sass与Compass
- idea运行固定多个模块项目
- IDEA插件(Android Studio插件)开发示例代码及bug解决
- Django之django模型层二多表操作
- FMC
- MapReduce对交易日志进行排序的Demo(MR的二次排序)
- Weex 学习文档、跳转路径、控制台输出、we转js汇总
- sqlite3常用指令