如何判断数据是否服从正态分布
判断数据是否服从正态分布的方法:
1、Q-Q图:
此Q-Q非用于聊天的QQ,Q是quantile的缩写,即分位数。分位数就察烂是将数据从小到大排序,然后切成100份,看不同位置处的值。比如中位数,就是中间位置的值。
Q-Q图的x轴为分位数,y轴为分位数对应的样本值。x-y是散点图的形式,通过散点图可以拟合出一条直线, 如果这条直线是从左下角到右上角的一条直线,则可以判断数据符合正态分布,否则则不可以。
2、直方图:
直方图分为两种,一种是频率分布直方图,一种是频数分布直方图。频数就是样本值出现的次数,频率是某个值出现的次数与所有样本值出现总次数的比值。
与直方图类似的还有茎叶图,茎叶图是类似于表格形式去表示每个值出现的频次。
统计检验方法:
KS检验是基于样本累积分布函数来进行判断的。可以用于判断某个样本集是否符合某个已知分布,也可以用于检验行兄两个样本之间的显著性差异。如果是判断某个样本是否符合某个已知分布,比如正态分布,则需要先计算出标准正态分布败带漏的累计分布函数。
然后在计算样本集的累计分布函数。两个函数之间在不同的取值处会有不同的差值。我们只需要找出来差值最大的那个点D。然后基于样本集的样本数和显著性水平找到差值边界值(类似于t检验的边界值)。
判断边界值和D的关系,如果D小于边界值,则可以认为样本的分布符合已知分布,否则不可以。