六西格玛培训咨询中统计学的基础知识是什么?
2017-03-22 · 中国六西格玛奠基人
1.误差
测量误差分为系统误差和随机误差。误差的产生是自然的,意料中的事情。因此我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而且非常注意如何选取这些样本,以减少偏差。
2.误差的处理
统计学一般采用统计描述,统计推理和试验设计三种方法来分析误差。
统计描述:用图表和几个总结性数字(均值、方差、标准差)描述一组数据。
统计推理:确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。(置信区间和假设检验)
试验设计:收集并分析数据,以估算过程变化的影响。
3.连续数据和离散数据
连续数据:连续可变的数据,如身高,重量等。
离散数据:如地区或分类,是非等信息。
4.统计学基本术语
总体:也叫母体,用N表示
样本:总体的一个子集,用n表示
均值(Mean):平均值,总体的用u表示,样本的用xbar表示
中位数:排序后中间那个数
方差(Variance):总体的用sigma平方,样本的为s平方表示,注意分母是除以N或n
均方差(Stdev):总体的用sigma,样本的用s,注意分母是除以N-1或n-1
5.正态分布
它是自然界最常见的一种分布。如某地区人员的身高,某机器生产的零件的尺寸。在研究正态分布的时候,我们一般只需要抽取少量的样本就可以把握总体的趋势。
注意标准的正态分布是指均值为0,标准差为1的正态分布
Z值的计算:我们需要利用正态分布的平均值和标准差将其转化为“标准正态”分布,以便使用标准正态分布表来获得概率。
Zusl=(USL-u)/Sigma; Zlsl = (u-LSL)/Sigma
ZBench 是与出现缺陷的总概率相对应的Z值,可从正态表中查到。
6.中心极限定律
中心极限定理表明,如果n足够大,样本平均值( x )或其总和的分布,都近似于正态分布,无论单个变量是否服从正态分布。
7.稳定性因子
将数据排序后四等分,可以获取到1/4位置的Q1和3/4位置的Q3,稳定性因子SF= Q1/Q3
随着偏差的降低,稳定性因子越来越接近1.0