spss进行线性回归分析时,相关系数都符合,但是显著性不符合,如何调整
线性回归时候,相关系数只是表明了各个系数之间的相关程度。但是自变量对因变量不显著的话,可能存在多重共线性、数据存在异常值、异方差的问题。
1、自变量存在共线性问题
在进行线性回归分析时,很容易出现自变量共线性问题,通常情况下VIF值大于10说明严重共线,VIF大于5则说明有共线性问题。当出现共线性问题时,可能导致回归系数的符号与实际情况完全相反,本应该显著的自变量不显著,本不显著的自变量却呈现出显著性。
解决方法:手动移除出共线性的自变量,先做下相关分析,如果发现某两个自变量X(解释变量)的相关系数值大于0.7,则移除掉一个自变量(解释变量),然后再做回归分析。逐步回归法,让软件自动进行自变量的选择剔除,逐步回归会将共线性的自变量自动剔除出去。
2、数据存在异常值,如果数据中存在极端异常值,会导致数据偏移对分析结果产生严重影响。如果回归分析出现各类异常,可通过比如描述分析、箱线图、散点图等方法,找出并处理掉异常值后再做分析。
解决方法:查看数据中是否有异常值,可通过箱线图、散点图查看,剔除异常值可通过SPSSAU“异常值”功能进行剔除。
3、异方差,如果模型存在明显的异方差性,会影响回归系数的显著情况,得到的回归模型是低效并且不稳定的。
解决方法:保存残差项,将残差项分别与模型的自变量X或者因变量Y,作散点图,查看散点是否有明显的规律性。如果有明显的异方差性,建议重新构建模型,比如对Y取对数后再次构建模型等。
如果排除了这些原因还是不显著,那么基本说明该变量对被解释变量无显著影响。
扩展资料
在做实证就是做回归等等方法的时候,一般就看中三点,一是相关系数,看因变量和自变量是否相关。二是拟合优度(R平方),看回归方程拟合的好不好,一般0.8以上就算拟合的比较好了。
三是自变量的系数对于因变量是否显著啦,P值小于0.05就说明自变量对于因变量是显著的。如果自变量的P值都比0.05大,那就说明自变量对于因变量是不显著的,这个自变量就没什么意义,所以如果变量比较多的情况下,还是做一下逐步回归。
如果变量比较少,做逐步回归就会导致最后有可能只剩下一个变量。逐步回归就是一个模型优化的过程,更加能解释自变量和因变量之间的关系,一般回归之后效果不好都要逐步回归来优化线性模型的。
线性回归时候,相关系数只是表明了各个系数之间的相关程度。但是自变量对因变量不显著的话,只能说明自变量多因变量影响不大,可以考虑换其他的跟因变量关系更加大的变量。或者在自变量多的情况下,用逐步回归的方法,提取出与因变量相关最大的自变量。
多谢你的回答!!!已经尝试换了很多数据可是就是不行,另外自变量与自变量之间有偏相关性说明什么问题能不能请问一下??线性回归分析做好的方法是逐步回归法吗??跪谢你的回答~~!!
偏相关系数不能说明什么问题啊,我们在做实证就是做回归等等方法的时候,一般就看中三点,一是相关系数,看因变量和自变量是否相关。二是拟合优度(R平方),看回归方程拟合的好不好,一般0.8以上就算拟合的比较好了。三是自变量的系数对于因变量是否显著啦,P值小于0.05就说明自变量对于因变量是显著的。如果自变量的P值都比0.05大,那就说明自变量对于因变量是不显著的,这个自变量就没什么意义啦,所以如果变量比较多的情况下,还是做一下逐步回归吧,如果变量比较少,做逐步回归就会导致最后有可能只剩下一个变量。逐步回归就是一个模型优化的过程,更加能解释自变量和因变量之间的关系,一般回归之后效果不好都要逐步回归来优化你的线性模型的。