Please enable JavaScript to view this site.

解读正态性检验

正态性检验的结果用 P 值来表示,它可以回答这个问题:

如果您的模型是正确的,并且模型周围的所有残差都服从高斯分布,那么获得残差与高斯分布偏离程度与您的数据一样大(或更大)的数据的概率是多少?

如果 P 值很大,则残差通过了正态性检验。如果 P 值较小,则残差未通过正态性检验,有证据表明您的数据不符合回归的某个假设。需要考虑的问题

拟合不同的模型

对数据进行不同的加权

排除异常值

较大的 P 值意味着数据符合回归假设(但肯定不能证明模型是正确的)。在数据点数量较少的情况下,正态性检验的检验力很小,无法检测出数据与高斯分布的适度偏离。

正态性检验的工作原理

我们建议使用D'Ágostino-Pearson 正态性检验。它首先计算偏斜度和峰度,以量化分布在不对称性和形状方面离高斯分布有多远。然后计算这两个值与高斯分布期望值的差异程度,并根据这些差异的总和计算出一个 P 值。这是一种用途广泛、检验力强大(与其他一些检验方法相比)的正态性检验方法,值得推荐。请注意,D'Agostino 开发了多种正态性检验方法。Prism 使用的是 "总括 K2 "检验。

Shapiro-Wilk 正态性检验是另一种选择。我们更倾向于使用 D'Agostino-Pearson 检验,原因有二。一个原因是,如果每个残差都是唯一的,Shapiro-Wilk 检验的效果会很好,但如果几个残差是相同的,它的效果就不好了。另一个原因是,非数学家很难理解检验的基础。

Prism 的早期版本只提供Kolmogorov-Smirnov 检验。我们仍然提供这种检验(为了保持一致性),但 不再推荐使用。该检验将数据的累积分布与期望值累积高斯分布进行比较,其 P 值仅基于最大差异。这种评估正态性的方法并不十分灵敏,我们现在同意这样的说法1:"Kolmogorov-Smirnov 检验只是一种历史奇观。它不应该被使用"。

最初发布的 Kolmogorov-Smirnov 方法假定您知道总体的平均值和 SD 值(可能来自以前的工作)。在分析数据时,您很少知道总体的均值和标差。您只知道样本的均值和 SD。因此,为了计算 P 值,Prism 使用了 Dallal 和 Wilkinson 对 Lilliefors 方法的近似 P 值(《美国统计学家》,40:294-296,1986 年)。由于该方法只对较小的 P 值准确,因此 Prism 只需报告较大 P 值的 "P>0.10"。

Prism 8 增加了Anderson-Darling 检验。Kolmogorov-Smirnov检验只考察实际分布与高斯分布之间最大的差异,而Anderson-Darling检验则汇总所有差异。Prism 使用 Anderson-Darling 检验的形式,纠正了使用样本平均数和样本标差,而不知道与数据进行比较的总体平均数和标差这一事实。

参考文献                                                                                        

1RB D'Agostino,"Tests for Normal Distribution" inGoodness-Of-Fit Techniquesedited by RB D'Agostino and MA Stepenes,Macel Decker,1986。

© 1995-2019 GraphPad Software, LLC. All rights reserved.