X与Y之间的关系能否用直线表示?在许多实验中,X与Y之间的关系是曲线的,因此线性回归并不适用。将数据进行变换以强行使其呈线性关系通常收效甚微。更好的做法是使用非线性曲线拟合。
数据点在直线周围的散布是否呈高斯分布(至少近似如此)?线性回归分析假设数据在最佳拟合直线周围的分布呈高斯分布。换言之,它假设残差(数据点到最佳拟合直线的垂直距离)服从高斯(正态)分布。
数据变异性在各处是否一致?线性回归假设数据点在最佳拟合线周围的离散分布沿整个曲线具有相同的标准偏差。如果 X 值较高或较低的数据点往往离最佳拟合线更远,则该假设不成立。 标准偏差在各处均相的假设被称为同方差性。(如果散点随Y值增加而增加,则需要进行加权回归。Prism无法通过线性回归分析实现这一点。此时应使用非线性回归,但选择拟合直线模型。
您是否精确知道 X 值?线性回归模型假设 X 值完全准确,且实验误差或生物变异性仅影响 Y 值。这种情况很少见,但只要假设 X 值的测量误差与 Y 值的变异性相比非常小,这一假设就足够了。
数据点之间是否相互独立?某个数据点位于直线上方或下方纯属偶然,且不会影响另一个数据点位于直线上方或下方。为了正确解读结果,您的数据应满足这一假设。
请注意,Prism 目前尚不提供处理重复测量设计(混合效应模型)的方法。 例如,一项实验对四只不同动物各进行六次测量,将产生总计 24 个数据值。尽管实际情况并非如此,Prism 仍会将这些数据视为包含 24 个独立数据点。如果在本示例中,某只动物在所有时间点的测量值均较高,Prism 将无法处理这些重复测量,导致结果可能产生误导。
X 和 Y 值是否相互关联?如果 X 的值用于计算 Y(或 Y 的值用于计算 X),则线性回归计算将失效。一个典型例子是 Scatchard 图,其中 Y 值(结合/游离)是根据 X 值计算得出的。 另一个例子是期中考试成绩(X)与总课程成绩(Y)的对比图。由于期中考试成绩是总课程成绩的组成部分,因此线性回归对这些数据并不适用。