判定系数是什么意思?
决定系数(coefficient of determination),有的教材上翻译为判定系数,也称为拟合优度。表示可根据自变量的变异来解释因变量的变异部分。
如某学生在某智力量表上所得的 IQ 分与其学业成绩的相关系数 r=0.66,则决定系数 R^2=0.4356,即该生学业成绩约有 44%可由该智力量表所测的智力部分来说明或决定。
作用
判定系数只是说明列入模型的所有解释变量对因变量的联合的影响程度,不说明模型中单个解
释变量的影响程度。
对时间序列数据,判定系数达到0.9以上是很平常的;但是,对截面数据而言,能够有0.5就不错了。
决定系数的大小决定了相关的密切程度。
当R2越接近1时,表示相关的方程式参考价值越高;相反,越接近0时,表示参考价值越低。这是在一元回归分析中的情况。但从本质上说决定系数和回归系数没有关系,就像标准差和标准误差在本质上没有关系一样。
在多元回归分析中,决定系数是通径系数的平方。
表达式:R^2=SSR/SST=1-SSE/SST
其中:SST=SSR+SSE,SST (sum of squares for total)为总平方和,SSReg (sum of squares for regression为回归平方和,SSE (sum of squares for error) 为残差平方和。
区别
判定系数和相关系数的区别
用例
判定系数达到多少为宜?
没有一个统一的明确界限值;
若建模的目的是预测因变量值,一般需考虑有较高的判定系数。
若建模的目的是结构分析,就不能只追求高的判定系数,而是要得到总体回归系数的可信任的估计量。判定系数高并不一定每个回归系数都可信任。