有40个数据,其中最大值为35,最小值为15,若组距为4,则应该分得组数是
有40个数据,其中最大值为35,最小值为15,若组距为4,则应该分得组数是5。
因为在样本数据中最大值与最小值的差为35-16=19,又因为组距为4,所以组数=19÷4=4.75,所以应该分成5组。
确定组数多少和组距大小的原则是:将总体分布的规律和原则显示出来,可以看出总体单位的集中程度,或集中趋势,从被研究的现象实际情况出发,将相同性质的总体单位归到一组,不同性质的区别开来,即组内同质性、组间差异性。
由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。
组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。
采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。根据分组整理成频数分布表。所以统计关键是分组,然后数据整理就方便了。
扩展资料:
在所研究总体一定的情况下,组数的多少和组距的大小是紧密联系的。一般说来,组数和组距成反比关系。在对同一现象进行分组时,组数少,则组距大;组数多,则组距小。
如果组数太多,组距过小,会使分组资料繁琐、庞杂,难以显现总体内部的特征和分布规律;如果组数太少,组距过大,可能会失去分组的意义,达不到正确反映客观事实的目的。
参考资料:百度百科-组数
注意,分组时,整数后要加1
为甚要加1 ?
你可以试一下,如果不加1,最后一组中不包括最大数,在分组时,如果整数,最后的组数就是商再加上1.
又∵组距为4,
∴组数=19÷4=4.75,
∴应该分成5组.
20÷4=5
分成5组