“计划内比较”这一术语用于描述专注于少数几个在科学上合理的比较的情况。您不会进行所有可能的比较,也不会先查看数据再决定进行哪些比较。相反,您会作为实验设计的一部分,决定只进行少数几个比较。
部分统计学家建议,当仅进行少数计划内比较时,无需对多重比较进行校正。其理由是,由于研究设计聚焦明确,因此可获得额外的功效作为回报。
Prism 软件始终会进行多重比较校正,无论这些比较是预先规划的还是事后进行的。但一旦您意识到,当仅需比较一对均值时,计划内比较与针对选定均值对的 Bonferroni 校正比较是完全等价的,您就可以让 Prism 为您自动执行计划内比较。
在下图中,第一列显示控制数据,第二列显示经处理后的数据。该实验旨在验证处理是否会改变测得的活性(Y轴所示)。为确保溶剂(用于溶解处理物的溶剂)不会影响结果,实验还设置了另一组不含溶剂的对照组(第三列)。 为确保实验正常进行,收集了非特异性(空白)数据,并将其显示在第四列中。

单因素方差分析 |
|
|
|
|
P值 |
P<0.0001 |
|
|
|
P值汇总 |
*** |
|
|
|
均值是否存在显著差异?(P < 0.05) |
是 |
|
|
|
组数 |
4 |
|
|
|
F |
62.69 |
|
|
|
R平方 |
0.9592 |
|
|
|
|
|
|
|
|
方差分析表 |
SS |
自由度 |
均方差 |
|
处理(列间) |
15050 |
3 |
5015 |
|
残差(列内) |
640 |
8 |
80 |
|
总计 |
15690 |
11 |
|
|
|
|
|
|
|
Tukey多重比较检验 |
均值差 |
q |
P值 |
差异的95%置信区间 |
对照组与治疗组 |
22.67 |
4.389 |
P > 0.05 |
-0.7210 至 46.05 |
对照组与不含载体对照组 |
-0.3333 |
0.06455 |
P > 0.05 |
-23.72 至 23.05 |
对照组 vs 空白组 |
86.33 |
16.72 |
P < 0.001 |
62.95 至 109.7 |
治疗组 vs 无载体对照组 |
-23 |
4.454 |
P > 0.05 |
-46.39 至 0.3877 |
处理组 vs 空白组 |
63.67 |
12.33 |
P < 0.001 |
40.28 至 87.05 |
含载体组与空白对照组 |
86.67 |
16.78 |
P < 0.001 |
63.28 至 110.1 |
总体方差分析(ANOVA)的P值非常低,因此可以拒绝“所有数据均采样自组平均值相同的组”这一零假设。但这其实帮助不大。第四列是阴性对照组,其数值自然远低于其他组。方差分析的P值回答了一个其实无需探讨的问题。
采用Tukey多重比较检验对所有均值两两进行了比较(见上表)。您仅关注第一组比较 - 对照组与处理组 - 该比较在统计学上不显著(P>0.05)。
这些结果并未真正回答您实验设定的核心问题。Tukey多重比较检验将5%的显著性水平适用于全部六组比较。但这六组比较中有五组并未涉及具有科学意义的问题。您本就预期空白组的数值会远低于其他组。若非如此,鉴于实验未成功,您根本不会费心进行分析。 同样地,如果含载体对照组(第一列)与不含载体对照组(第三列)存在显著差异,您本就不必费心分析其余数据。这些是对照测量,旨在确保实验系统正常运行。将它们纳入方差分析及后检验中,只会降低您检测目标差异的功效。
由于此处您仅关注一项比较,因此仅比较对照组和处理组的数据是合理的。
在 Prism 的单因素方差分析(ANOVA)对话框中,选择“所选列对之间的 Bonferroni 比较”,并仅选择一对列。

该差异在 P<0.05 时具有统计学显著性,且均值差的 95% 置信区间为 5.826 至 39.51。
在报告结果时,请务必说明您的 P 值和置信区间未针对多重比较进行校正,因此这些 P 值和置信区间仅适用于您报告的每个具体数值,而非整个比较族。
在本示例中,我们计划仅进行一次比较。若计划进行多次比较,请采用Fisher 最小显著差法(Fisher's LSD)进行多重比较。在报告结果时,请务必说明这是计划内比较,因此未对 P 值或置信区间进行多重比较校正。
计划内比较分析依赖于方差分析(ANOVA)的假设,包括所有数据均采自具有相同离散程度的组这一假设。因此,即使您只想比较两个组,也会使用所有组的数据来估计组内离散程度,从而获得更多的自由度,进而提高功效。
在此情境下,该假设似乎存疑。空白组的离散程度小于对照组和处理组样本。另一种方法是完全忽略控制数据(在利用对照组验证实验有效性后),并使用 t 检验来比较处理组与对照组的数据。 t 比值通过将两组均值之差(22.67)除以该差值的标准误差(5.27,由两个标准偏差和样本量计算得出)来计算,因此等于 4.301。被比较的两组共有六个数据点,因此自由度为四。 P值为0.0126,两个均值之差的95%置信区间为8.04至37.3。
首先计算第1组与第2组之间差异的标准误差。计算方法如下,其中N1和N2是待比较两组的样本量(本示例中均为3),MSresidual是单因素方差分析报告的残差均方(本示例中为80.0):
或者等价地
在本示例中,第1列与第2列均值之差的标准误差为7.303。
现在计算 t 比值,即均值之差(22.67)除以该差值的标准误差(7.303)。 因此 t=3.104。由于 MSerror 是根据全部数据计算得出的,其自由度数与方差分析表中的残差自由度数相同,本示例中为 8(总数据点数减去组数)。相应的 P 值为 0.0146。
95% 置信区间从观测均值开始,其范围等于差异的标准误差(7.303)乘以 t 分布在 95% 置信水平和 8 个自由度下的临界值(2.306)。因此,该差异的 95% 置信区间为 5.826 至 39.51。