中位数和平均数的区别是什么?
中位数(Median)又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。
平均数的作用。
平均数既可以用它来反映一组数据的一般情况和平均水平,也可以用它进行不同组数据的比较,分析组与组之间的差别。用平均数能直观简明表示一组数据的情况,如平均速度、平均身高、平均产量、平均成绩、平均收入等等。例如,我们要比较北京和山西两地居民收入水平,无法将这两个地方的每一个家庭的收入一一进行比较,最简单直接的方法就是比较两地居民的平均收入水平。
算术平均数是最常用的一种平均指标,几何平均数多用于计算比率平均数,它受极端值影响较算术平均数小。
中位数与平均数在计算方法以及数据变动的影响上面有明显区别。
一、计算方法
平均数用所有数据相加的总和除以数据的个数,需要计算才得求出。(在选手比赛成绩统计中通常会去掉一个最高分和一个最低分,以示公平)。
中位数将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。它的求出不需或只需简单的计算。
二、数据变动的影响
平均数与每一个数据都有关,其中任何数据的变动都会相应引起平均数的变动。主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低。
中位数与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响。
2023-06-09 · 百度认证:SPSSAU官方账号,优质教育领域创作者
中位数与平均数有什么不同之处呢?
平均数:
平均数又称均值,是最常用的一个数据代表值,平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准。
根据样本数据的不同格式,这里介绍两种常见的算术平均数的计算方法,一种是简单算术平均数,另一种是加权算术平均数。
我们都知道在进行数据分析时,通常有两种数据格式。一种是常规格式(非加权格式),另外一种是加权数据格式。分别说明如下:
第一种常规格式(非加权格式),一行代表一个样本,如果有100个样本即为100行;一列代表一个属性;这类格式最为常见,而且此类数据格式可以做任何的分析。因为其携带着所有最原始的数据信息。类似如下表:
此时使用简单算术平均,公式如下
这就是我们小学学的计算平均值的方法,把要算的这组数据的每个数相加,然后除以样本数。
比如收集100个样本,最终男性40名,女性60名,录入的数据为汇总统计数据,单独一列(或多列)表示各类别的样本数量;如下表:
这种数据格式就不是原始的数据,而是经过分组整理了,使用加权算术平均数计算,公式:
中位数:
中位数是样本数据升序排列后的最中间的数值,如果数据偏离较大,一般用中位数描述整体水平情况。
中位数的计算分两种情况:
当数据个数为奇数时:
中位数即最中间的数,如果有N个数,则中间数的位置为(N+1)/2
比如,一个班的5位学生的成绩分别为:30 70 40 50 80,中位数是什么呢?
①先把这五个分数从小到大排序:30 40 50 70 80。
②算出中位数应该在排序后的数列中的位置:(5+1)/2=3。
③所以中位数就正好是处在第三个位置的分数值,即50。
当数据个数为偶数时:
中位数为中间两个数的平均值,中间位置的算法是(N+1)/2。
比如,一个班有六位学生,考试成绩分别是:30 70 80 40 90 60,中位数是什么呢?
①先把这五个分数从小到大排序:30 40 60 70 80 90。
②算出中位数应该在排序后的数列中的位置:(6+1)=3.5。
③因为位置必须是整数,但现在是小数,所以为了公平,把在3.5左右两个位置(第三位和第四位)都拿出来。取两个位置的分数值的平均值作为中位数:(60+70)/2=65。
从中位数的计算方法可以看出,它和每个数据的位置有关系,所以如果有极端值出现,无论是特别大或特别小的极端值,都会因为对所有样本数据排序的这个动作,而被排列到某个数列的两端去,它不会有机会被排序到中间位置,而中位数是最中间位置的数,所以极端值不会影响到中位数,这样当有极端值出现,我们无法用平均值很好的描述数据情况,就可以使用中位数。
可以使用SPSSAU快速得到平均数和中位数。