为什么数据要进行方差分析?
2023-06-02 · 百度认证:SPSSAU官方账号,优质教育领域创作者
为什么数据要进行方差分析?
方差分析(单因素方差分析),用于分析定类数据与定量数据之间的关系情况。例如研究人员想知道三组学生的智商平均值是否有显著差异。方差分析可用于多组数据,比如本科以下,本科,本科以上共三组的差异;而下述t 检验仅可对比两组数据的差异。
案例背景:分析不同学历之间的工作人员薪资是否有差异。其中1.0代表高中毕业,2.0代表专科,3.0代表本科学历,4.0代表研究生学历,工资中1代表薪水范围为4000~5000,2代表薪水范围为5000~6000,3代表薪水范围为6000~7000,4代表薪水范围为7000~8000,5代表薪水范围为8000~9000(数据只适用于此案例分析)。
学历对于薪资呈现出0.05水平显著性(p=0.000<0.05)同时也可以使用折线图进行直观展示。总结可知:不同学历样本对于薪资全部均呈现出显著性差异。
上述折线图展示的是学历和薪资方差分析对比,从图中可以看出不同学历样本对于薪资均有着差异性。并且学历越高,工资越多。
除此之外SPSSAU还提供了方差分析中间过程值表以及方差分析结果的普通格式以及简化纵向格式,如下:
进行方差分析需要数据满足以下两个基本前提:
各观测变量总体要服从正态分布。
各观测变量的总体满足方差齐。
这是方差分析的两个基本前提条件,理论上讲,数据必须满足以上两个条件才能进行方差分析,如不满足,则使用非参数检验。
但现实研究中,数据多数情况下无法到达理想状态。正态性检验要求严格通常无法满足,实际研究中,若峰度绝对值小于10并且偏度绝对值小于3,或正态图基本上呈现出钟形,则说明数据虽然不是绝对正态,但基本可接受为正态分布,此时也可使用方差分析进行分析。
方差分析的用途:
1、两个或多个样本均数间的比较。
2、分析两个或多个因素间的交互作用。
3、回归方程的线性假设检验。
4、多元线性回归分析中偏回归系数的假设检验。
5、两样本的方差齐性检验等。
由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。