中心极限定理
中心极限定理 :
设从均值为μ、方差为σ 2 总体中抽取样本量为n的样本,当抽取次数充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ 2 /n 的正态分布。
中心极限定理是统计学里非常伟大的定理,对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间; 实际应用中,很多分布往往是很杂乱的,但是根据中心极限定理,样本均值的抽样分布(取无穷次样本均值)是趋向于正态分布的 (如图, 点这里可以自行模拟 ),这个正态分布的方差(拗口的说,是样本均值的抽样分布的方差)我们可以用 样本方差/n 近似估计,均值(拗口的说,是样本均值的抽样分布的均值)等于 总体均值 ,具体是多少我们不需要知道,因为我们的实际的样本(均值)就在这个分布里, 总体均值在实际样本均值的上下某个范围m的概率 = 实际样本均值在总体均值上下某个范围m的概率 = 实际样本均值在抽样分布里 样本均值的抽样分布的均值 上下某个范围m的概率 ,我们已经知道了这个抽样分布的标准差,就可以通过这个范围求得 z 统计量(距离均值有几个标准差) , 所以这里我们不需要知道样本均值的抽样分布的均值或者总体均值 !最终我们可以依据正态分布的检验公式进行下一步分析,得到对总体均值的近似估计,譬如标准误差,置信区间,显著性水平等。
PS:这里有个样本均值的抽样分布,对应下图的蓝色直方图。样本均值的抽样分布的均值就是蓝色直方图的均值,有点绕口。