样本方差为什么除以n-1
样本方差除以n-1是因为:这样的方差估计量才是关于总体方差的无偏估计量。
两者形式一样,唯一的差别在于一个分母除了n-1,一个是除了n,那为什么样本和总体的方差会有这样的区别呢?方差用来计算每一个变量(观察值)与总体均数之间的差异,所以总体方差为N。但实际的统计不可能去计算全部的,所以只能用样本来推算总体方差,所以从概念上来说,样本方差是总体方差的无偏估计。
但样本因为会受到一些偏见样本的影响,就像比赛打分需要去掉一个最高分,一个最低分一样,所以需要对样本进行一些数据校正,这个校正叫“贝塞尔校正”。那为什么是n-1了。这里引入一个自由度的概念。随机的数里,自由度就是数的量,比如X1,X2,告诉你X1是多少,你是算不出X2多少的,此时的自由度就是2。
越是自由,那么方差肯定越小,总体的自由度个数就是N。但这时引入X平均,当你知道X1和X平均,你就知道X2了。也就是此时的自由度因为X平均的出现受到了限制,成为了n-1。而自由度变小了,方差就会变大,为了校正这个变大的数据,所以需要除以n-1。
样本方差含义:
样本方差就是先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。均值是指在一组数据中所有数据之和再除以数据的个数。在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。
当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。 可以看出,估计的方差趋于零。