Please enable JavaScript to view this site.

要检查多元回归是否适合这些数据的分析,请自问以下问题。

每个 X 变量和 Y 之间是线性关系吗?

在许多实验中,X 和 Y 之间是非线性关系,因此不适合进行多元回归。在某些情况下,您或许可以对一个或多个 X 变量进行变异性处理,从而建立线性关系。您也可以将数据限制在有限的 X 变异性范围内,在此范围内的关系接近线性。有些程序(但 GraphPad 软件公司目前还没有)可以对多个自变量进行非线性回归。

残差(实际值与预测 Y 值之间的差异)是高斯分布(至少近似)吗?

多元回归假设残差的分布是随机和高斯分布。

各处的变异性是否相同?

多元回归假设所有 X 值的数据与模型预测值的散差具有相同的标准偏差。如果 X 值较高(或较低)的点也倾向于远离拟合优度线,则违反了这一假设。各地标准偏差相同的假设称为同方差分析。Prism 提供不等权重,但假设加权残差平均在任何地方都是相同的。

您是否精确知道 X 值?

回归模型假设所有 X 值都完全正确,实验误差或生物变异性只影响 Y 值。这种情况很少发生,但假设测量 X 的任何不精确性与 Y 的变异性相比都非常小就足够了。

数据点是否独立?

一个数值高于或低于回归模型的预测值应该是随机的,不应该影响另一个点高于或低于回归线。

是否过度拟合?

和所有统计学一样,回归的目的是分析样本数据并对总体做出有效推断。使用多元回归技术并不总能实现这一目标。我们很容易得出适用于样本数据拟合的结论,但这些结论在总体中并不真实。当研究重复进行时,结论将无法再现。当您提出的问题多于数据所能回答的问题时,就会出现这种情况--与受试者人数相比,模型中的自变量太多。多少自变量才算多?对于多元回归,经验法则是每个自变量(Prism 中的列)至少要有 10-20 个受试者(案例;Prism 中的行)。因此,拟合一个包含五个自变量的模型需要大约 50 到 100 个受试者或病例。这只是一个经验法则,并不是一个严格的标准。

真的过度拟合了吗?

如果您的病例数少于变异性,那么您的分析几乎肯定是毫无意义的。

 

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.