设X1,X2,…Xn是取自总体X的一个简单随机样本,Xba和S^2分别为样本均值和样本方差,证明:
因为.X与S2分别为总体均值与方差的无偏估计,且二项分布的期望为np,方差为np(1-p),故E(.X)=np,E(S2)=np(1-p).从而,由期望的性质可得,E(T)=E(.X)-E(S2)=np-np(1-p)=np2.故答案为:np2。
扩展资料:
当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
样本均值的抽样分布是所有的样本均值形成的分布,即μ的概率分布。样本均值的抽样分布在形状上却是对称的。
随着样本量n的增大,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值μ,方差为总体方差的1/n。这就是中心极限定理(central limit theorem)。
设总体共有N个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有N·n 种抽法,即可以成N·n不同的样本,在不重复抽样时,共有N·n个可能的样本。
每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。但现实中不可能将所有的样本都抽取出来,因此,样本均值的概率分布实际上是一种理论分布。
参考资料来源:百度百科-方差