Please enable JavaScript to view this site.


“单因素方差分析”对话框的“选项”选项卡有两个帮助屏幕:

本页面介绍多重比较选项。

另一页面则介绍了图形和输出选项


选择哪种多重比较检验?

首先,选择进行多重比较检验的方法

使用统计假设检验对多重比较进行校正。

通过控制错误发现率来校正多重比较。

不进行多重比较校正。每次比较均独立进行。

如果您不确定应采用哪种方法,Prism 会默认选择第一种,原因有三:

这是最常规的做法

结果包含实际的多重性校正 P 值,而非仅显示 P 值是否小于某个阈值,或差异是否被视为“发现”

该类别中的大多数检验都会报告置信区间(我们认为这是理解结果的最佳方式)

选择方法后,请选择具体检验。可选方案取决于您在“多重比较”(第二)选项卡中指定的目标,以及您在“实验设计”(第一)选项卡中是否选择了“假设标准差相等”。

使用统计假设检验进行多重比较校正

将每个均值与其他所有均值进行比较

可选方案依赖于您在方差分析(ANOVA)对话框的第一个选项卡中是否假设方差齐性(即标准差相等,因此方差相等)。

若假设方差齐性(标准差相等),您的选项包括:

Tukey检验(推荐)

Bonferroni

Sidak

Holm-Sidak。该检验比Tukey方法(3)更具检验力,这意味着它有时能在Tukey方法无法发现统计学显著差异的情况下发现显著差异。该检验无法计算置信区间,因此我们更倾向于使用Tukey检验

Newman-Keuls检验。我们仅为兼容旧版Prism及其他软件而提供此检验,但建议您避免使用。问题在于它无法将家族错误率维持在指定水平(1)。在某些情况下,I类错误的概率可能高于您指定的α水平

若不假设方差齐性(即标准差相等),您的选择包括:

Games-Howell(推荐用于大样本)

Dunnett T3(推荐用于每组样本量小于50的情况)

Tamhane T2

三种方法均可计算置信区间和多重性校正后的P值。

比较对照组均值与其他组均值

若假设方差齐性(标准差相等),可选方法包括:

Dunnett's(推荐)

Bonferroni

Sidak

Holm-Sidak。Glantz指出,Holm检验的检验力应高于Dunnett检验,但据他所知,这一问题尚未得到深入探讨(2)。该检验无法计算置信区间或多重性校正P值,因此我们更倾向于采用Dunnett检验

若不假设方差齐性(方差相等),您的选择包括:

Dunnett T3(推荐)

Tamhane T2

比较预先指定的列对的均值

若假设方差齐性(标准差相等),您的选择包括:

Bonferroni(最常用)

Sidak(检验力更强,因此推荐)

Holm-Sidak(无法计算置信区间)

如果不假设方差齐性(方差相等),您的选择包括:

Games-Howell(推荐)

Dunnett T3

Tamhane T2

通过控制错误发现率对多重比较进行校正

Prism 提供了三种控制错误发现率的方法。所有方法都会决定将哪些(如果有)比较标记为“发现”,并确保错误发现率控制在您输入的阈值 Q 之下。

FDR方法虽不常作为方差分析(ANOVA)的后续检验,但并无充分理由如此。该方法可将比较归类为“发现”或非“发现”,但不计算P值或置信区间。

请勿对多重比较进行校正。每次比较均独立进行。

若选择此方法,Prism将执行Fisher 最小显著差(LSD)检验。  

该方法(Fisher  LSD)在检测差异方面具有更强的检验力。但它更可能错误地得出差异在统计学上显著的结论。当进行多重比较校正时(Fisher  LSD 不会进行此操作),显著性阈值(通常为 5% 或 0.05)适用于整个比较族。而使用Fisher  LSD 时,该阈值会分别应用于每个比较。

仅当您有充分理由时才使用Fisher LSD方法,并在报告结果时务必详细说明所采用的具体操作。

多重比较选项

交换比较方向

此选项的唯一作用是改变所有报告的均值差异的符号。若勾选此选项,2.3 的差异将变为 -2.3;若勾选此选项,-3.4 的差异将变为 3.4。这纯粹取决于个人偏好,取决于您如何理解数据。

为每次比较报告经多重性校正的 P 值

若选择 Bonferroni、Tukey 或 Dunnett 多重比较检验,Prism 也可报告经多重性校正的 P 值。勾选此选项后,Prism 将针对每次比较报告一个校正后的 P 值。这些计算不仅考虑了被比较的两个组,还考虑了方差分析(ANOVA)中组的总数(数据集列数)以及所有组中的数据。 对于邓奈特检验,Prism 仅在多重性校正后的 P 值大于 0.0001 时才会报告该值。否则将报告“<0.0001”(在 Prism 8 之前,Prism 报告的是 0.0001,不带小于符号)。

多重比较校正P值是整个比较族中,某项特定比较被(勉强)判定为“统计学显著”时的最小显著性阈值(α)。

直到最近,多重性校正 P 值才开始被广泛报告。如果您选择让 Prism 计算这些值,请务必花时间确保您理解其含义。如果您在出版物或演示文稿中包含这些值,请务必解释它们的含义。

置信水平与显著性水平(或期望的FDR)

传统上,置信区间通常按95%置信水平计算,统计学显著性则采用0.05的α值定义。Prism允许您选择其他数值。若您选择控制FDR,请为Q(以百分比表示)设定数值。若将Q设为5%,则预期最多5%的“发现”属于假阳性。

下一页将介绍绘图和输出选项

参考文献

1.SA Glantz,《生物统计学入门》,第六版,ISBN= 978-0071435093。

2.MA Seaman、JR Levin 和 RC Serlin,《心理学公报》110:577-586,1991。

3.Cohen, J. (1988). 《行为科学检验力分析》(第2版)。新泽西州希尔斯代尔:劳伦斯·厄尔鲍姆联合出版社。