Prism 中既包含一组普通多项式方程,也包含一组中心化多项式方程。例如,在多项式列表中,您会看到“二阶多项式”和“中心化二阶多项式”。我们建议始终选择中心化方程之一,而不是普通多项式方程。本页将解释原因。
标准的多项式模型形式如下:
Y= B0 + B1*X +B2*X^2
高阶方程中包含更多项。
多项式拟合存在两个问题:
•当X值较大且起始值远高于零时(例如,当X表示日历年),将这些极大的X值提升到高次幂可能会导致数学运算溢出。即使程序未报告任何数学错误,结果也可能不准确。由于部分系数为正而部分为负,Y的值取决于从一个巨大数值中减去另一个巨大数值,从而导致结果不精确。
•即使 X 值不大,模型参数之间也相互交织,因此具有较高的协方差和依赖度。这会导致标准误差较大、置信区间较宽,以及置信带或预测区间非常宽。在许多情况下,这个问题非常严重,以至于 Prism 会报告结果“模糊拟合”,因此不会为所有参数报告置信区间,也无法绘制置信带。
当 X 值经过中心化处理后,上述两个问题均可消除。中心化的原理是在拟合模型前,从所有 X 值中减去 X 的均值。这可以通过非线性回归实现,使用以下模型:
XC = X - Xmean
Y = B0 + B1*XC + B2*XC²
这里 XC 是中心化后的 X 值,等于 X 值减去 Xmean,即所有 X 值的均值。换言之,XC 代表任意 X 值与所有 X 值均值之间的距离。Xmean 是常数,并非 Prism 试图拟合的参数。当然,您可以在 Y 的定义中加入更多项,以构建更高阶的多项式方程。
拟合中心化模型将得到完全相同的曲线(除非常规方法导致了数学错误)。因此,平方和保持不变,模型比较的结果也保持不变。
然而,中心化方程已对模型进行了重新参数化。参数的含义不同,因此具有不同的控制数据(除第一个参数外,其余均相同)、不同的标准误差和置信区间、更小的协方差和依赖度,以及更窄的置信带和预测区间。
您无需了解Prism如何实现该模型,即可将数据拟合到内置的中心化多项式方程中。若您对此感兴趣,请继续阅读。
如上所示,内置的中心化多项式方程集通过将参数 XMean 约束为“数据集常数(= Mean X)”,从而使其等于 X 值的均值。
若您使用 Prism 5.02 或 5.0b 之前的版本打开包含中心化多项式回归的文件,该约束条件将丢失,中心化多项式回归将无法正常工作。