多重比较方法

使用统计假设检验对多重比较进行校正

其中部分方法允许计算置信区间和多重性校正P值，而部分方法则不支持。我们推荐使用能够计算置信区间和多重性校正P值的检验方法，理由有二：

•对于大多数人而言，置信区间比关于统计学显著性的陈述更容易解读。

•经多重性校正的 P 值能提供比单纯判断差异是否统计学显著更丰富的信息。

可计算置信区间和多重性校正P值的方法

此对话框第五个选项卡中可用的检验列表依赖于您在第四个选项卡中指定的目标。

•如果您正在比较每一行（或列）的均值与其他所有行（或列）的均值，我们建议使用 Tukey 检验。

•如果您要将对照组行（或列）均值与其他行（或列）均值进行比较，我们建议使用Dunnett 检验。

•如果您要进行一组独立比较，我们建议使用 Sidak 方法，该方法与 Bonferroni 方法非常相似，但检验力略高一些。

无法计算置信区间或多重性校正 P 值的方法

如果您不关心查看和报告置信区间，选择这些检验中的任意一种可以获得稍高的检验力。对话框第三个选项卡中可用的检验列表依赖于您在第二个选项卡中指定的目标。

•如果您正在将每一行或列的均值与其他所有行或列的均值进行比较，我们建议您选择Holm-Sidak检验，其检验力高于图基法 (3)。这意味着对于某些数据集，Holm-Sidak法能在图基法无法发现统计学显著差异的情况下，检测出显著差异。出于历史原因（以便旧版 Prism 生成的文件能够打开），我们提供了 Newman-Keuls 检验，但建议您避免使用该方法，因为它无法将家族错误率维持在指定水平(1)。在某些情况下，I 类错误的发生概率可能高于您指定的显著性水平。

•若您是将各列均值与对照组均值进行比较，Prism仅提供Holm-Šídák检验。Glantz指出Holm检验的检验力应强于Dunnett检验，但据他所知，这一观点尚未得到深入探讨(2)。

•若您要进行一系列独立比较，Prism 仅提供 Holm-Šídák 检验

通过控制错误发现率来校正多重比较

Prism 提供了三种控制错误发现率的方法。所有方法都决定将哪些（如有）比较标记为“发现”，并确保错误发现率控制在您输入的阈值 Q 以下。

FDR方法虽不常作为方差分析（ANOVA）的后续检验，但并无充分理由限制其应用。

不进行多重比较校正。每次比较均独立进行

若选择此方法，Prism 将执行Fisher 最小显著差（LSD）检验。

该方法（Fisher LSD）在检测差异方面具有更强的检验力。但它更可能错误地得出差异在统计学上显著的结论。当您对多重比较进行校正时（Fisher LSD 不会这样做），显著性阈值（通常为 5% 或 0.05）适用于整个比较族。而使用Fisher LSD 时，该阈值会分别应用于每个比较。

仅在有充分理由的情况下才使用Fisher LSD方法，并在报告结果时务必详细说明所采用的具体方法。

多重比较

交换比较方向

此选项的唯一作用是改变所有报告的均值差异的符号。若勾选此选项，2.3 的差异将变为 -2.3；若勾选此选项，-3.4 的差异将变为 3.4。这纯粹取决于个人偏好，取决于您如何理解数据。

为每次比较报告经多重性校正的 P 值

若选择 Bonferroni、Tukey 或 Dunnett 多重比较检验，Prism 也可报告经多重性校正的 P 值。勾选此选项后，Prism 将为每次比较报告一个校正后的 P 值。这些计算不仅考虑了被比较的两个组，还考虑了方差分析（ANOVA）中组的总数（数据集列数）以及所有组中的数据。

多重比较校正 P 值是整个比较族中，某项特定比较被（勉强）判定为“统计学显著”时的最小显著性阈值（α）。

直到最近，多重性校正 P 值才开始被广泛报告。如果您选择让 Prism 计算这些值，请务必花时间确保您理解其含义。如果您在出版物或演示文稿中包含这些值，请务必解释它们的含义。

置信水平与显著性水平（或期望的FDR）

传统上，置信区间通常按95%置信水平计算，统计学显著性则采用0.05的α值定义。Prism允许您选择其他数值。若您选择控制FDR，请为Q（以百分比表示）设定数值。若将Q设为5%，则预期最多5%的“发现”属于假阳性。

参考文献

1.SA Glantz，《生物统计学入门》，第六版，ISBN= 978-0071435093。

2.MA Seaman, JR Levin 和 RC Serlin, 《心理学公报》110:577-586, 1991.

3.Cohen, J. (1988). 《行为科学检验力分析》（第2版）。新泽西州希尔斯代尔：劳伦斯·厄尔鲍姆出版社。

Please enable JavaScript to view this site.