变异系数cv是对不同数据变异性的相对度量,与标准差s相比,它剔除了不同数据本身高度的差异,更易衡量不同数据变异性的差异。
条件,当所对比的两个数列的水平高低不同时,就不能采用全距、平均差或标准差百行对比分析,因为它们都是绝对指标,其数值的大小不仅受各单位标志值差异程度的影响。
对于同一数据内某一观测值来说,衡量它变异程度的指标是看它偏离平均值多少倍的标准差,叫做z分数。
计算公式:z分数=(xi-x均值)/s,对于常见的正态分布,z分数超过【-2,2】的观测值通常称为异常值(outlier),在正态分布中,出现异常值的概率为5%。