Please enable JavaScript to view this site.

Prism 可以通过报告残差的标准偏差来量化拟合优度,该标准偏差采用三种不同的方法计算。请记住,残差是指数据点到拟合直线或曲线的垂直距离(以 Y 单位为单位)。如果有 n 个数据点,回归后将得到 n 个残差。

单位是什么?如何解读?

这三个值(RMSE、Sy.x 和 RSDR)均采用与 Y 变量相同的单位表示,且其解读方式大致与数据点相对于直线或曲线的典型偏差相同。

均方根误差(RMSE)

若仅计算这 n 个值的标准偏差,该值即为均方根误差(RMSE)。残差的均值始终为零,因此计算标准偏差时,需先求残差平方和,除以 n-1,再取平方根:

当您在“诊断”选项卡中勾选相应选项时,Prism 会报告 RMSE,因为某些字段会使用该指标。但我们建议报告 Sy.x(如下)。

Sy.x 或 Se

Sy.x 的计算方法与此非常相似,但分母为 n-K,其中 K 是回归拟合的参数个数。n-K 即为回归的自由度。若仅拟合一个参数,则 RMSE 和 Sy.x 数值相同。 若拟合两个或更多参数,Sy.x 值会更大,且能更好地反映拟合优度。我们建议报告 Sy.x 而非 RMSE。

RSDR

若选择稳健回归,Prism 会计算一个称为残差稳健标准偏差(RSDR)的指标。其目的是计算不受异常值影响的稳健标准偏差。在高斯分布中,68.27% 的数据点位于均值一个标准偏差范围内。 因此,我们计算该值并称之为 P68。事实证明该值会略微低估标准差,因此 RSDR 的计算方法是将 P68 乘以 n/(n-K),其中 K 表示拟合的参数个数。