概率论。不是说“样本方差的期望值等于总体方差”吗?
DYi并不是样本方差的期望,把它代入样本方差的期望表达式中正好可以验证样本方差的期望等于总体的方差。
设总体为X,抽取n个i.i.d.的样本X1,X2,...,Xn,其样本均值为Y = (X1+X2+...+Xn)/n
其样本方差为S =( (Y-X1)^2 + (Y-X2)^2 + ... + (Y-Xn)^2 ) / (n-1)
为了记号方便,我们只看S的分子部分,设为A
则 E A =E( n * Y^2 - 2 * Y * (X1+X2+...+Xn) + (X1^2 + X2^2 +...+ Xn^2))
=E( (X1^2 + X2^2 +...+ Xn^2) - n * Y^2 )
注意 EX1 = EX2 = ... = EXn = EY = EX;
VarX1 = VarX2 = ... = VarXn = VarX = E(X^2) - (EX)^2
VarY = VarX / n (这条不是明显的,但是可以展开后很容易地证出来,而且也算是一个常识性的结论)
所以E A = n(VarX + (EX)^2) - n * (VarY + (EY)^2)
= n(VarX + (EX)^2) - n * (VarX/n + (EX)^2)
= (n-1) VarX
所以 E S = VarX;得证。
扩展资料:
实际上,样本方差可以理解成是对所给总体方差的一个无偏估计。E(S^2)=DX。
n-1的使用称为贝塞尔校正(Bessel's correction),也用于样本协方差和样本标准偏差(方差平方根)。
平方根是一个凹函数,因此引入负偏差(由Jensen不等式),这取决于分布,因此校正样本标准偏差(使用贝塞尔校正)有偏差。 标准偏差的无偏估计是一个技术上涉及的问题,尽管对于使用术语n-1.5的正态分布,形成无偏估计。
无偏样本方差是函数ƒ(y1,y2)=(y1-y2)2/2的U统计量,这意味着它是通过对群体的两个样本统计平均得到的。
参考资料来源:百度百科-样本方差