样本方差为什么除以n-1
在容量为N的总体中,假设我们已经通过随机抽样的方式获得了一份容量为n的样本数据。现在我们有两个任务需要完成:一是归纳样本本身这n个数据之间的分布状况;二是借助该样本来推测总体的分布状况,亦即尝试以局部推测总体、以偏概全。
出于简便的考虑,我们经常仅仅借助均值和方差这两个指标来简略地描述样本或总体的分布状况。则对于第一项任务而言,为准确描述样本数据间的离散程度,样本方差计算公式中的除数应为"n”。类似地,为准确描述总体数据间的离散程度,总体方差计算公式中的除数应为"N”。
然而,如果我们准备借助样本方差来推测总体的方差,则可以证明:以"n”为除数的样本方差计算公式不是总体方差的无偏估计值计算式,而只有以"n-1”为除数的样本方差计算公式才是总体方差的无偏估计值计算式。因此在推断统计领域,样本方差计算式的除数应为"n-1”,而不应为"n”。
当然,在n足够大的时候,样本方差这两种计算方法之间的差异可以忽略不计。
最后,我将上述阐述归纳如下:
1. 设若总体数据已知,则该总体的数字特征不存在推测的问题,只存在描述的问题,是故总体方差计算公式中的除数应为"N”。
2. 以"n-1”为除数的样本方差计算公式是总体方差的无偏估计值计算式。
3. 以"n”为除数的样本方差计算公式是总体方差的渐近无偏估计值计算式。
4. 如果只是要描述样本数据间的离散程度,则样本方差计算公式中的除数应为"n”。
5. 当n足够大的时候,不必太在意样本方差计算公式中除数的这两种不同的选择。
6. 在多数场合,习惯上总是采用以"n-1”为除数的样本方差计算方式。
论证如下:
同学不理解的地方可以继续提问哦>0<满意的话请采纳吧^-^
来源网址——http://lidequan12345.blog.163.com/blog/static/289850362012711101133709/
因为抽样计算的平均值肯定跟全部系统整体数据平均有差别,均方差也会有差别。要估算的话,根据概率分布等公式拟合反推, N-1是比较吻合的(数据比较多时)