在使用线性回归分析数据之前,请先停下来问问自己:使用非线性回归拟合数据是否更合理。如果您曾对非线性数据进行变换以建立线性关系,那么几乎可以肯定,直接对原始数据进行非线性回归拟合会得到更好的结果。
在非线性回归尚未普及之前,分析非线性数据的最佳方法是将数据进行转换以生成线性图,然后使用线性回归分析这些转换后的数据。例如,酶动力学数据的Lineweaver-Burk图、结合数据的Scatchard图以及动力学数据的对数图。
这些方法已过时,不应用于数据分析
这些方法的问题在于,变换会扭曲实验误差。线性回归假设散点在直线周围的分布遵循高斯分布,且在每个 X 值处标准差均相等。这些假设在数据变换后很少成立。 此外,某些变换会改变X与Y之间的关系。例如,在Scatchard图中,X的值(结合量)被用于计算Y(结合量/游离量),这违反了线性回归的假设 - 即所有不确定性都存在于Y中,而X是精确已知的。如果相同的实验误差同时出现在X和Y两个方向上,那么最小化点与直线垂直距离的平方和就毫无意义。
由于线性回归的假设被违反,从回归直线的斜率和截距推导出的数值并非模型中变量的最精确估计。考虑到您在数据收集上投入的大量时间和精力,您自然希望采用最佳技术来分析数据。非线性回归能产生最精确的结果。
下图展示了数据转换的问题。左侧面板显示的数据遵循矩形双曲线(结合等温线)。右侧面板是同一数据的Scatchard图。左侧的实线曲线由非线性回归确定。右侧的实线显示了经过Scatchard转换后该曲线的形态。虚线显示了转换后数据经线性回归拟合的结果。 Scatchard图可用于确定受体数(Bmax,由线性回归直线的X截距确定)和解离常数(Kd,由斜率的负倒数确定)。由于Scatchard变换放大了数据散布并导致其失真,因此线性回归拟合无法提供最精确的Bmax和Kd值。

不要仅仅为了避免使用非线性回归而采用线性回归。使用非线性回归拟合曲线并不困难。
尽管通常不建议分析经过变换的数据,但展示线性变换后的数据往往很有帮助。许多人发现,对变换后的数据进行视觉解读更为容易。这合乎情理,因为人眼和大脑在进化过程中适应于识别边缘(直线) - 而非识别矩形双曲线或指数衰减曲线。即使您使用非线性回归分析数据,展示线性变换后的结果也可能是合理的。