为什么要用R²来看拟合效果的好坏,而不是用残差平方和?

最小二乘法计算平方和,永远是正值,所以只有最小值没有最大值上限,所以你可以比较不同模型的残差平方和来确定一个模型比另一个模型更好,但是不能确定这个模型到底有多好。

另外如果是对同一组数据进行建模,使用最小二乘法可能有意义,但是假如对于不同数据组建模,数据量的大小不同或者其它性质不同,建出来的模型比较残差平方和没有意义。例如时间序列,对某数据最近一年和最近十年的数据分别建模,数据量不同残差平方和就没有可比性

R2就好很多,其一,它有范围,0~1,你可以对任意不同模型进行公平的比对,并且能够看出来和一个完美的模型比较,这个模型有多好,其二,从它的定义形式上讲基本是normalized残差平方和。

为什么要用R²来看拟合效果的好坏,而不是用残差平方和?插图

图是wiki的,https://en.wikipedia.org/wiki/Coefficient_of_determination,其中SSres就是残差平方和,SStot是总体的平方和,你可以看到它其实是normalized成一个分数,然后用1减就可以了。那两张方块的坐标图的解释也非常形象了。


作者:知乎用户
链接:https://www.zhihu.com/question/391275893/answer/1187589988
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

默认图片
bossliu
清醒 专注 努力
文章: 499

留下评论

Captcha Code