正态分布
也叫钟形曲线
正态分布的基本特征:
对于 描述统计 ,比如100名学生每天消耗的平均卡路里,最常吃的视频等等,描述统计一般只用来描述一个具体的样本。
但是,当想研究的不再是描述一个样本,而是某周岁即出现的准确概率,比如学生每日平均消耗2000卡路里的概率是多少,正态分布就有助于正确使用 概率统计量 。
此外,如果想从样本推断总体, 推断统计 ,用于决定样本中观测到的一些现象是否代表了总体的一种实际现象,比如比较男女每日平均消耗的卡路里之间是否有差异,就可以用到正态分布。
正态分布是 理论分布 , 很少有得自样本的取值严格服从正态分布。
违背正态分布假设的最明显结果就是与正态分布有关的概率不再有效
正态分布和抽样方法的关系:
正太分布的概率取决于:
峰度 和 偏度 是用来描述分布的特征,如果一个样本取值不服从正态分布,
那么他可能服从不同形态的分布。如果少数取值在较大的一端,拖出一个长尾, 叫做 正偏 ,反之叫做 负偏
偏度不影响中位数,所以正偏的均值大于中位数,负偏均值小于中位数,正态分布,二者相等。
峰度 指的是一个分布的平坦程度的形态,如果一个分布定点高于正态分布的顶尖,叫做 尖峰分布 ,反之叫做 扁峰分布 。
对于正态分布,有大约 68% 的取值落入均值加减1个标准差的区间内, 尖峰分布 在均值周围的比例更大,扁峰分布更少