Please enable JavaScript to view this site.

什么是计划内比较?

“计划内比较”这一术语用于描述专注于少数几个在科学上合理的比较的情况。您不会进行所有可能的比较,也不会先查看数据再决定进行哪些比较。相反,您会作为实验设计的一部分,决定只进行少数几个比较。

部分统计学家建议,当仅进行少数计划内比较时,无需对多重比较进行校正。其理由是,由于研究设计聚焦明确,因此可获得额外的功效作为回报。

Prism 软件始终会进行多重比较校正,无论这些比较是预先规划的还是事后进行的。但一旦您意识到,当仅需比较一对均值时,计划内比较与针对选定均值对的 Bonferroni 校正比较是完全等价的,您就可以让 Prism 为您自动执行计划内比较。

分析有误的示例数据

在下图中,第一列显示控制数据,第二列显示经处理后的数据。该实验旨在验证处理是否会改变测得的活性(Y轴所示)。为确保溶剂(用于溶解处理物的溶剂)不会影响结果,实验还设置了另一组不含溶剂的对照组(第三列)。 为确保实验正常进行,收集了非特异性(空白)数据,并将其显示在第四列中。

以下是单因素方差分析及Tukey多重比较检验的结果,该检验将每个组与其他所有组进行了比较。

单因素方差分析

 

 

 

 

P值

P<0.0001

 

 

 

P值汇总

***

 

 

 

均值是否存在显著差异?(P < 0.05)

 

 

 

组数

4

 

 

 

F

62.69

 

 

 

R平方

0.9592

 

 

 

 

 

 

 

 

方差分析表

SS

自由度

均方差

 

处理(列间)

15050

3

5015

 

残差(列内)

640

8

80

 

总计

15690

11

 

 

 

 

 

 

 

Tukey多重比较检验

均值差

q

P值

差异的95%置信区间

对照组与治疗组

22.67

4.389

P > 0.05

-0.7210 至 46.05

对照组与不含载体对照组

-0.3333

0.06455

P > 0.05

-23.72 至 23.05

对照组 vs 空白组

86.33

16.72

P < 0.001

62.95 至 109.7

治疗组 vs 无载体对照组

-23

4.454

P > 0.05

-46.39 至 0.3877

处理组 vs 空白组

63.67

12.33

P < 0.001

40.28 至 87.05

含载体组与空白对照组

86.67

16.78

P < 0.001

63.28 至 110.1

 

总体方差分析(ANOVA)的P值非常低,因此可以拒绝“所有数据均采样自组平均值相同的组”这一零假设。但这其实帮助不大。第四列是阴性对照组,其数值自然远低于其他组。方差分析的P值回答了一个其实无需探讨的问题。

采用Tukey多重比较检验对所有均值两两进行了比较(见上表)。您仅关注第一组比较 - 对照组与处理组 - 该比较在统计学上不显著(P>0.05)。

这些结果并未真正回答您实验设定的核心问题。Tukey多重比较检验将5%的显著性水平适用于全部六组比较。但这六组比较中有五组并未涉及具有科学意义的问题。您本就预期空白组的数值会远低于其他组。若非如此,鉴于实验未成功,您根本不会费心进行分析。 同样地,如果含载体对照组(第一列)与不含载体对照组(第三列)存在显著差异,您本就不必费心分析其余数据。这些是对照测量,旨在确保实验系统正常运行。将它们纳入方差分析及后检验中,只会降低您检测目标差异的功效。

包含计划内比较的示例数据

由于此处您仅关注一项比较,因此仅比较对照组和处理组的数据是合理的。

在 Prism 的单因素方差分析(ANOVA)对话框中,选择“所选列对之间的 Bonferroni 比较”,并仅选择一对列。

该差异在 P<0.05 时具有统计学显著性,且均值差的 95% 置信区间为 5.826 至 39.51。

在报告结果时,请务必说明您的 P 值和置信区间未针对多重比较进行校正,因此这些 P 值和置信区间仅适用于您报告的每个具体数值,而非整个比较族。

在本示例中,我们计划仅进行一次比较。若计划进行多次比较,请采用Fisher 最小显著差法(Fisher's LSD)进行多重比较。在报告结果时,请务必说明这是计划内比较,因此未对 P 值或置信区间进行多重比较校正。

通过 t 检验分析的示例数据

计划内比较分析依赖于方差分析(ANOVA)的假设,包括所有数据均采自具有相同离散程度的组这一假设。因此,即使您只想比较两个组,也会使用所有组的数据来估计组内离散程度,从而获得更多的自由度,进而提高功效。

在此情境下,该假设似乎存疑。空白组的离散程度小于对照组和处理组样本。另一种方法是完全忽略控制数据(在利用对照组验证实验有效性后),并使用 t 检验来比较处理组与对照组的数据。 t 比值通过将两组均值之差(22.67)除以该差值的标准误差(5.27,由两个标准偏差和样本量计算得出)来计算,因此等于 4.301。被比较的两组共有六个数据点,因此自由度为四。 P值为0.0126,两个均值之差的95%置信区间为8.04至37.3。

计划内比较的计算方法

首先计算第1组与第2组之间差异的标准误差。计算方法如下,其中N1和N2是待比较两组的样本量(本示例中均为3),MSresidual是单因素方差分析报告的残差均方(本示例中为80.0):

或者等价地

在本示例中,第1列与第2列均值之差的标准误差为7.303。

现在计算 t 比值,即均值之差(22.67)除以该差值的标准误差(7.303)。 因此 t=3.104。由于 MSerror 是根据全部数据计算得出的,其自由度数与方差分析表中的残差自由度数相同,本示例中为 8(总数据点数减去组数)。相应的 P 值为 0.0146。

95% 置信区间从观测均值开始,其范围等于差异的标准误差(7.303)乘以 t 分布在 95% 置信水平和 8 个自由度下的临界值(2.306)。因此,该差异的 95% 置信区间为 5.826 至 39.51。