能反映回归直线拟合优度的指标有
能反映回归直线拟合优度的指标有:相关系数、剩余变差(或残差平方和)。
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R²。R²最大值为1。R²的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R²的值越小,说明回归直线对观测值的拟合程度越差。
R²衡量的是回归方程整体的拟合度,是表达因变量与所有自变量之间的总体关系。R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比(在MATLAB中,R²=1-“回归平方和在总平方和中所占的比率”)。
实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。统计上定义剩余误差除以自由度n-2所得之商的平方根为估计标准误。
为回归模型拟合优度的判断和评价指标,估计标准误显然不如判定系数R²。R²是无量纲系数,有确定的取值范围(0—1),便于对不同资料回归模型拟合优度进行比较;而估计标准误差是有计量单位的,又没有确定的取值范围,不便于对不同资料回归模型拟合优度进行比较。
拟合优度检验:
主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。当解释变量为多元时,要使用调整的拟合优度,以解决变量元素增加对拟合优度的影响。
假定一个总体可分为r类,现从该总体获得了一个样本——这是一批分类数据,需要我们从这些分类数据中出发,去判断总体各类出现的概率是否与已知的概率相符。
譬如要检验一颗骰子是否是均匀的,那么可以将该骰子抛掷若干次,记录每一面出现的次数,从这些数据出发去检验各面出现的概率是否都是1/6,拟合优度检验就是用来检验一批分类数据所来自的总体的分布是否与某种理论分布相一致。