样本方差为什么要除以n-1高等代数
因为样本方差是每个数减去平均数之后的平方,而平均数的求得过程会减少一个数的作用力。
例如:
求二个数的方差,当知道一个数和平均数的时候,直接就可以求得另外一个数了,而不需要一定需要知道另外一个数,所以另外一个数对整体方差的作用力就没有啥用了,同理类推,当N的数的时候,能够起到实际作用的就是N-1,所以要除以的是N-1,而不是N。
一般情况下求D(S^2)并不容易,但如果总体服从正态分布N(μ,σ^2),则(n-1)S^2/σ^2服从自由度为n-1的卡方分布,从而D[(n-1)S^2/σ^2]=2(n-1),可由此间接求出D(S^2)。
在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。 当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。
扩展资料:
实际上,样本方差可以理解成是对所给总体方差的一个无偏估计。E(S^2)=DX。
n-1的使用称为贝塞尔校正(Bessel's correction),也用于样本协方差和样本标准偏差(方差平方根)。 平方根是一个凹函数,因此引入负偏差(由Jensen不等式),这取决于分布,因此校正样本标准偏差(使用贝塞尔校正)有偏差。 标准偏差的无偏估计是一个技术上涉及的问题,尽管对于使用术语n-1.5的正态分布,形成无偏估计。
参考资料来源:百度百科-样本方差