
以避免极端数据造成的不良影响。
当用平均数来表示一个数据的“集中趋势”时,如果数据中出现一、两个极端数据,那么平无均数对于这组数据所起的代表作用就会削弱,为了消除这种现象,可将少数极端数据去掉,只计算余下的数据的平均数,并把所得的结果作为全部数据的平均数。
介绍
从本质上来说,算术平均数也存在缺点。因其运算需要涉及到整组所有的数据,其中任何数据的变动都会引起平均数的变动,所以平均数极易受到极端值的影响,当出现偏大数时,平均数会较高,当出现偏小数时,平均数会降低。
因此,在比赛评分采用算数平均数时,应去掉数据组中的极端数值,即最高值和最低值。
去掉最高分和最低分,避免了个别评委对舞者的极端好恶,能将舞者的舞蹈水平评判得更为公正。甚至有时会去掉两个最高分和最低分,以更大程度地过滤掉评分过程中的异常情况,让比赛更为客观公平。
以舞蹈比赛评分为例,假设对于某位舞者的表现,10个评委分别打出了分数,一种情况是可以直接计算平均分,但如果去掉一个最高分和一个最低分,再计算得出的平均分就会有差别。
平均数,也就是算术平均数,指的是所有数据的总和除以总数后所得的商,其代表着某一组数据的整体水平,表征的是集中量。此外,中位数、众数等也是常用的集中量。
中位数即是将所有数据从小到大或从大到小依次排列后位于中间的那个数(或中间两个数的平均数)。而众数则是一组数据中出现次数最多的那个数。
每一类集中量都有其独特的性质和应用范围。算术平均数的重要性质之一是各变量与平均数的离差之和等于零,性质之二是各变量对于平均数的离差方之和最小。
也就是说,算术平均数是误差最小的总体表征值。正是因为算术平均数的严谨性,同时在表达上简单、直观,更能作进一步的代数运算。因此在所有的集中量中,算数平均数的应用范围最为广泛,能有效地反映日常生活中批量数据的整体水平。