用SPSS作Logistic回归分析,结果能说明什么
2023-06-01 · 百度认证:SPSSAU官方账号,优质教育领域创作者
Logistic回归分析,结果能说明什么
以有序logit回归进行举列。
有序Logit(Logistic)回归Y为定类且有序,类别通常较少,比如3~8个之间。
比如当前有一份研究数据是用来研究民众幸福度影响因素,包括性别,年龄,学历和年收入水平共4个潜在的影响因素对于幸福水平的影响情况。幸福水平共由三项表示,分别是“不幸福,比较幸福和十分幸福”,由于Y为定类数据且有序,因而适用于有序Logit回归分析。
SPSSAU操作如下:
SPSSAU共输出五个表格,分别是因变量频数分布统计表格,平行性检验表格,模型似然比检验表格,回归模型分析结果表格和回归模型预测准确率表格。
第1个表格展示因变量各个类别的分布情况。如果因变量各类别分布非常分散,则需要对类别进行重新组合后再次进行分析。同时,如果因变量的类别个数非常多,也需要针对类别进行重新组合后才能进行分析。
第2个表格展示模型的平行性检验,检验的原假设为模型满足平行性,因而如果p 值大于0.05则说明模型接受原假设,即符合平行性检验。反之如果p 值小于0.05则说明模型拒绝原假设,模型不满足平行性检验。平行性是有序Logit回归的前提条件,如果不满足平行性,SPSSAU建议使用多分类Logit回归模型。
第3个表格展示模型的似然比检验结果,其原假设是模型的回归系数全部均为0,因此如果p 值小于0.05,则说明拒绝原假设,即说明模型有效;反之如果p 值大于0.05则说明接受原假设,即说明模型回归系数全部均应该为0,模型无意义。同时上表格还列出赤池信息准则AIC和BIC 值,如果进行过多次模型分析(比如模型的自变量个数变化时),然后需要对比模型的优劣,则可通过此两个指标进行分析,此两个指标值越小越好,没有固定范围标准。
第4个表格展示模型的结果,包括回归系数的显著性,模型R 2值等。上表格中包括因变量阈值,其值基本无意义,仅从数学角度上看有此值输出而已。
第5个表格展示模型的预测准确率情况,包括各个类别和整体的预测准确率。如果模型用于预测分析,则预测准确率非常重要,如果模型用于研究影响关系,则不太关注预测准确率值。通常情况下样本量较小,预测准确率均非常低,但是多数实证研究的目的在于研究影响关系,因而预测准确率的关注度较小。
主要是看各个自变量的假设检验结果,和系数。两个自变量都有统计学意义,系数分别为-5.423和0.001,也就是说,随着自变量一增加一个单位,因变量要降低5.423三个单位。自变量二同理。比如因变量是高血压患病与否,随着自变量一得增加,患病危险降低。说明自变量一为保护因素。
Logistic回归模型的适用条件:
1 、因变量为二分类的分类变量或某事件的发生率,并且是数值型变量。但是需要注意,重复计数现象指标不适用于Logistic回归。
2 、残差和因变量都要服从二项分布。二项分布对应的是分类变量,所以不是正态分布,进而不是用最小二乘法,而是最大似然法来解决方程估计和检验问题。
3 、自变量和Logistic概率是线性关系
4 、各观测对象间相互独立。
扩展资料
1、软件功能
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。
用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。
其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。
对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。
2、Logistic回归实质
发生概率除以没有发生概率再取对数。就是这个不太繁琐的变换改变了取值区间的矛盾和因变量自变量间的曲线关系。究其原因,是发生和未发生的概率成为了比值 ,这个比值就是一个缓冲,将取值范围扩大,再进行对数变换,整个因变量改变。
不仅如此,这种变换往往使得因变量和自变量之间呈线性关系,这是根据大量实践而总结。所以,Logistic回归从根本上解决因变量要不是连续变量怎么办的问题。还有,Logistic应用广泛的原因是许多现实问题跟它的模型吻合。例如一件事情是否发生跟其他数值型自变量的关系。
参考资料来源:百度百科-logistic回归