在直方图上,如何确定中位数?
在样本中,有50%的个体小于或者等于中位数,同时也有50%的个体大于或者等于中位数,所以,在频率分布直方图中,在中位数的左边和右边直方图的面积是相等的。从而我们可以根据这个来估算出中位数的大小值。
其实每个矩形的面积就是这组数据的频率。你把每个矩形的面积从左加起,加到接近0.5时(没超过)用0.5减去之前加得的面积,再用减得的数值除以下一组的面积,再乘以组距,再加上在与上一组之间的数就得到了中位数。
比如:有4组数据:[0,10),[10,20),[20,30),[30,40],频率分别为0.1、0.2、0.3、0.4,那么你把前两组频率加起来,得0.3(再加第三组就超过0.5了),再0.5-0.3=0.2,再0.2/0.3约=0.67,再0.67*10=6.7最后20+6.7=26.7
扩展资料:
中位数(又称中值,英语:Median),统计学中的专有名词,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
中位数特点:
1)中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。
2)有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。
3)趋于一组有序数据的中间位置。
区别联系:
1)平均数是通过计算得到的,因此它会因每一个数据的变化而变化。
2)中位数是通过排序得到的,它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
3)众数也是数据的一种代表数,反映了一组数据的集中程度.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。
优缺点:平均数:需要全组所有数据来计算;易受数据中极端数值的影响。中位数:仅需把数据按顺序排列后即可确定;不易受数据中极端数值的影响。众数:通过计数得到;不易受数据中极端数值的影响。
参考资料:百度百科-中位数