求大神解答这里的r是如何算出来的?可追加悬赏,在线等,急!
线性回归方程中的相关系数r
r=∑(Xi-X的平均数)(Yi-Y平均数)/根号下[∑(Xi-X平均数)^2*∑(Yi-Y平均数)^2]
R2就是相关系数的平方,
R在一元线性方程就直接是因变量自变量的相关系数,多元则是复相关系数 判定系数R^2
也叫拟合优度、可决系数。表达式是: R^2=ESS/TSS=1-RSS/TSS
该统计量越接近于1,模型的拟合优度越高。
问题:在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。
——但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。
这就有了调整的拟合优度: R1^2=1-(RSS/(n-k-1))/(TSS/(n-1))
在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响: 其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。
总是来说,调整的判定系数比起判定系数,除去了因为变量个数增加对判定结果的影响。 R = R接近于1表明Y与X1, X2 ,…,Xk之间的线性关系程度密切; R接近于0表明Y与X1, X2 ,…,Xk之间的线性关系程度不密切