GraphPad Prism 11 Statistics Guide - 示例：计划比较

Zoom Window Out
Larger Text | Smaller Text
Hide Page Header
Show Expanding Text
Printable Version
Save Permalink URL

Navigation: 统计学原理 > 多重比较 > 处理多重比较的三种方法 > 方法 1：不进行多重比较校正

示例：计划比较

什么是计划内比较？

“计划内比较”这一术语用于描述专注于少数几个在科学上合理的比较的情况。您不会进行所有可能的比较，也不会先查看数据再决定进行哪些比较。相反，您会作为实验设计的一部分，决定只进行少数几个比较。

部分统计学家建议，当仅进行少数计划内比较时，无需对多重比较进行校正。其理由是，由于研究设计聚焦明确，因此可获得额外的功效作为回报。

Prism 软件始终会进行多重比较校正，无论这些比较是预先规划的还是事后进行的。但一旦您意识到，当仅需比较一对均值时，计划内比较与针对选定均值对的 Bonferroni 校正比较是完全等价的，您就可以让 Prism 为您自动执行计划内比较。

分析有误的示例数据

在下图中，第一列显示控制数据，第二列显示经处理后的数据。该实验旨在验证处理是否会改变测得的活性（Y轴所示）。为确保溶剂（用于溶解处理物的溶剂）不会影响结果，实验还设置了另一组不含溶剂的对照组（第三列）。为确保实验正常进行，收集了非特异性（空白）数据，并将其显示在第四列中。

以下是单因素方差分析及Tukey多重比较检验的结果，该检验将每个组与其他所有组进行了比较。

单因素方差分析
P值	P<0.0001
P值汇总	***
均值是否存在显著差异？（P < 0.05）	是
组数	4
F	62.69
R平方	0.9592

方差分析表	SS	自由度	均方差
处理（列间）	15050	3	5015
残差（列内）	640	8	80
总计	15690	11

Tukey多重比较检验	均值差	q	P值	差异的95%置信区间
对照组与治疗组	22.67	4.389	P > 0.05	-0.7210 至 46.05
对照组与不含载体对照组	-0.3333	0.06455	P > 0.05	-23.72 至 23.05
对照组 vs 空白组	86.33	16.72	P < 0.001	62.95 至 109.7
治疗组 vs 无载体对照组	-23	4.454	P > 0.05	-46.39 至 0.3877
处理组 vs 空白组	63.67	12.33	P < 0.001	40.28 至 87.05
含载体组与空白对照组	86.67	16.78	P < 0.001	63.28 至 110.1

总体方差分析（ANOVA）的P值非常低，因此可以拒绝“所有数据均采样自组平均值相同的组”这一零假设。但这其实帮助不大。第四列是阴性对照组，其数值自然远低于其他组。方差分析的P值回答了一个其实无需探讨的问题。

采用Tukey多重比较检验对所有均值两两进行了比较（见上表）。您仅关注第一组比较 - 对照组与处理组 - 该比较在统计学上不显著（P>0.05）。

这些结果并未真正回答您实验设定的核心问题。Tukey多重比较检验将5%的显著性水平适用于全部六组比较。但这六组比较中有五组并未涉及具有科学意义的问题。您本就预期空白组的数值会远低于其他组。若非如此，鉴于实验未成功，您根本不会费心进行分析。同样地，如果含载体对照组（第一列）与不含载体对照组（第三列）存在显著差异，您本就不必费心分析其余数据。这些是对照测量，旨在确保实验系统正常运行。将它们纳入方差分析及后检验中，只会降低您检测目标差异的功效。

包含计划内比较的示例数据

由于此处您仅关注一项比较，因此仅比较对照组和处理组的数据是合理的。

在 Prism 的单因素方差分析（ANOVA）对话框中，选择“所选列对之间的 Bonferroni 比较”，并仅选择一对列。

该差异在 P<0.05 时具有统计学显著性，且均值差的 95% 置信区间为 5.826 至 39.51。

在报告结果时，请务必说明您的 P 值和置信区间未针对多重比较进行校正，因此这些 P 值和置信区间仅适用于您报告的每个具体数值，而非整个比较族。

在本示例中，我们计划仅进行一次比较。若计划进行多次比较，请采用Fisher 最小显著差法（Fisher's LSD）进行多重比较。在报告结果时，请务必说明这是计划内比较，因此未对 P 值或置信区间进行多重比较校正。

通过 t 检验分析的示例数据

计划内比较分析依赖于方差分析（ANOVA）的假设，包括所有数据均采自具有相同离散程度的组这一假设。因此，即使您只想比较两个组，也会使用所有组的数据来估计组内离散程度，从而获得更多的自由度，进而提高功效。

在此情境下，该假设似乎存疑。空白组的离散程度小于对照组和处理组样本。另一种方法是完全忽略控制数据（在利用对照组验证实验有效性后），并使用 t 检验来比较处理组与对照组的数据。 t 比值通过将两组均值之差（22.67）除以该差值的标准误差（5.27，由两个标准偏差和样本量计算得出）来计算，因此等于 4.301。被比较的两组共有六个数据点，因此自由度为四。 P值为0.0126，两个均值之差的95%置信区间为8.04至37.3。

计划内比较的计算方法

首先计算第1组与第2组之间差异的标准误差。计算方法如下，其中N1和N2是待比较两组的样本量（本示例中均为3），MSresidual是单因素方差分析报告的残差均方（本示例中为80.0）：

或者等价地

在本示例中，第1列与第2列均值之差的标准误差为7.303。

现在计算 t 比值，即均值之差（22.67）除以该差值的标准误差（7.303）。因此 t=3.104。由于 MSerror 是根据全部数据计算得出的，其自由度数与方差分析表中的残差自由度数相同，本示例中为 8（总数据点数减去组数）。相应的 P 值为 0.0146。

95% 置信区间从观测均值开始，其范围等于差异的标准误差（7.303）乘以 t 分布在 95% 置信水平和 8 个自由度下的临界值（2.306）。因此，该差异的 95% 置信区间为 5.826 至 39.51。