Please enable JavaScript to view this site.

 


“双因素方差分析”对话框的“选项”选项卡有两个帮助屏幕:

本页面说明了多重比较选项。

另一页面则介绍了图形绘制和输出选项


使用统计假设检验对多重比较进行校正

其中部分方法允许计算置信区间和经多重性校正的 P 值,而部分方法则不支持。我们推荐使用能够计算置信区间和经多重性校正的 P 值的检验方法,理由有二:

对于大多数人而言,置信区间比关于统计学显著性的陈述更容易解读。

经多重性校正的 P 值能提供比单纯判断差异是否统计学显著更丰富的信息。

推荐方法

可用的检验列表取决于您在第二个选项卡中指定的目标。我们推荐以下这些检验,因为它们能够计算置信区间和多重性校正P值

如果您正在比较每一行(或列)的均值与其他所有行(或列)的均值,我们建议使用 Tukey 检验

如果您要将对照组行(或列)均值与其他行(或列)均值进行比较,我们建议使用Dunnett's 检验

如果您要进行一组独立比较,我们建议使用 Sidak 方法,该方法与 Bonferroni 非常相似,但检验力略高一些。

其他可用方法

提供 Bonferroni 和 Sidak 方法是为了与其他程序兼容,但我们认为选择这些检验并无优势。

如果您不关心置信区间的显示与报告,选择 Holm-Šídák 检验可以获得稍高的检验力。在比较所有均值对时,该方法的检验力高于 Tukey 方法 (3)。这意味着对于某些数据集,Holm-Šídák 方法能在 Tukey 方法无法发现统计学显著差异的情况下,检测出显著差异。 Glantz指出,Holm检验的检验力理应高于Dunnett检验,但据他所知,这一问题尚未得到深入探讨(2)

Prism 还因历史原因提供了Newman-Keuls检验(用于比较每个均值与其他所有均值),以便兼容旧版本 Prism 生成的文件,但我们建议您避免使用该方法,因为它无法将家族错误率维持在指定水平(1)。在某些情况下,I 类错误的概率可能高于您指定的显著性水平。  

通过控制错误发现率(FDR)校正多重比较

Prism 提供了三种控制错误发现率的方法。所有方法都决定将哪些(如有)比较标记为“发现”,并确保错误发现率控制在您输入的 Q 值以下。

FDR方法虽不常作为方差分析(ANOVA)的后续检验,但并无充分理由限制其应用。

不进行多重比较校正。每次比较均独立进行

若选择此方法,Prism 将执行Fisher 最小显著差(LSD)检验。  

该方法(Fisher  LSD)在检测差异方面具有更强的检验力。但它更可能错误地得出差异在统计学上显著的结论。当您对多重比较进行校正时(Fisher  LSD 不会这样做),显著性阈值(通常为 5% 或 0.05)适用于整个比较族。而使用Fisher  LSD 时,该阈值会分别应用于每个比较。

仅当您有充分理由时才使用Fisher LSD方法,并在报告结果时务必详细说明所采用的具体操作。

多重比较选项

交换比较方向

此选项的唯一作用是改变所有报告的均值差异的符号。若勾选此选项,2.3 的差异将变为 -2.3;若勾选此选项,-3.4 的差异将变为 3.4。这纯粹取决于个人偏好,取决于您如何理解数据。

为每次比较报告经多重性校正的 P 值

若您选择 Bonferroni、Tukey 或 Dunnett 多重比较检验,Prism 也可报告经多重性校正的 P 值。勾选此选项后,Prism 将为每次比较报告一个校正后的 P 值。这些计算不仅考虑了正在比较的两个组,还考虑了方差分析(ANOVA)中组的总数(数据集列数)以及所有组中的数据。

多重比较校正 P 值是整个比较族中,某项特定比较被(勉强)判定为“统计学显著”时的最小显著性阈值(α)。

直到最近,多重性校正 P 值才开始被广泛报告。如果您选择让 Prism 计算这些值,请务必花时间确保您理解其含义。如果您在出版物或演示文稿中包含这些值,请务必解释它们的含义。

置信水平与显著性水平(或期望的FDR)

传统上,置信区间通常按95%置信水平计算,统计学显著性则以0.05的α值定义。Prism允许您选择其他数值。若您选择控制FDR,请为Q(以百分比表示)设定数值。若将Q设为5%,则预期最多5%的“发现”属于假阳性。

 

参考文献

1.SA Glantz,《生物统计学入门》,第六版,ISBN= 978-0071435093。

2.MA Seaman, JR Levin 和 RC Serlin, 《心理学公报》110:577-586, 1991.

3.Cohen, J. (1988). 《行为科学检验力分析》(第2版)。新泽西州希尔斯代尔:劳伦斯·厄尔鲍姆出版社。