科学家使用非线性回归通常有两个截然不同的目标:
•将模型拟合到数据中,以获得参数的最佳拟合值,或者比较不同模型的拟合效果。如果这是您的目标,您必须谨慎选择模型(或两个备选模型),并关注所有结果。
•单纯拟合一条平滑曲线,以便从该曲线中插值,或者绘制一条平滑曲线的图表。若此为您的目标,仅需观察数据与曲线的图表即可评估结果,无需深入学习理论。请直接跳转至 Prism 插值功能的说明。
线性回归是将直线模型拟合到数据上。非线性回归则将这一概念扩展,用于将任意模型拟合到数据上。请区分非线性回归与线性回归,以及其他类型的回归。
线性回归和非线性回归的目标都是调整模型参数的值,以找到最接近数据的直线或曲线。 因此,线性回归的目标是找到使直线最贴近数据的最佳斜率和截距值。对于标准化剂量-反应曲线的非线性回归,目标则是调整 EC50(即引发介于最小和最大反应之间反应的浓度)的值以及曲线的斜率。
更准确地说,回归的目标是找到最可能正确的参数值。为此,需要对数据在曲线周围的离散程度做出假设。
最常见的假设是:数据点围绕一条理想曲线(或直线)随机分布,且其离散程度服从高斯分布。若接受这一假设,则回归的目标是调整模型参数,以求得使各点到曲线的垂直距离平方和最小化的曲线。
为何要最小化距离平方和?为何不直接最小化实际距离之和?
如果随机散布服从高斯分布,出现两个中等偏差(例如各5个单位)的可能性,远大于出现一个小偏差(1个单位)和一个大偏差(9个单位)的可能性。 如果采用最小化距离绝对值和的方法,那么对于一条距离两个点各5单位的曲线,与一条距离一个点1单位、另一个点9单位的曲线相比,前者并无优势。因为在两种情况下,距离之和(更准确地说,是距离绝对值之和)均为10单位。 而旨在最小化距离平方和的算法,则更倾向于使曲线与两个点各偏离5个单位(平方和为25),而非与一个点偏离1个单位、与另一个点偏离9个单位(平方和为82)。如果数据分布呈高斯分布(或近似高斯分布),那么通过最小化距离平方和确定的曲线最有可能正确。