Wilcoxon检验(Wilcoxon test)是一种用于比较两组配对数据的非参数检验。Prism 首先计算每组配对数据之间的差值,并将这些差值的绝对值按从小到大的顺序进行排序。 随后,Prism 分别计算 A 列数值较高时差值的秩和(称为正秩和),以及 B 列数值较高时差值的秩和(称为负秩和),并报告这两个秩和。如果两组中秩和的平均值差异显著,则 P 值将较小。
P值回答了以下问题:
如果 P 值较小,则可以拒绝“差异源于偶然”这一假设,并得出总体中位数不同的结论。
如果 P 值较大,数据无法支持总体中位数存在差异的结论。这并不等同于说中位数是相同的,只是目前没有令人信服的证据表明它们存在差异。如果样本量较小,Wilcoxon检验在检测微小差异方面的检验力较低。
若配对数少于 200 对,Prism 将计算精确 P 值。更多详情请参阅关于Wilcoxon符号秩检验的页面。Prism 6 及更高版本即使存在并列情况也能进行此计算。当配对数超过 200 对时,它将通过高斯近似法计算 P 值。此处所用的“高斯”一词与秩和的分布有关,并不意味着您的数据必须服从高斯分布。
如果部分受试者在干预前后的数值完全相同(两列数值完全一致),会发生什么情况?
Wilcoxon(Wilcoxon)在开发此检验时,建议直接忽略此类数据。假设共有十组配对数据:其中九组配对的前后值各不相同,但第十组配对的值完全相同,因此其差值为零。采用Wilcoxon原始方法时,该第十组配对将被忽略,仅对其余九组配对进行分析。InStat 以及 Prism 的早期版本(至第 5 版)均采用此处理方式。
Pratt(1,2) 提出了一种不同的方法来处理这些相等的值。Prism 6 及后续版本提供了使用该方法的选项。
您应该选择哪种方法?显然,如果没有任何一对数据的前后值相同,那么选择哪种方法都无所谓。即使存在这种情况,例如在200对数据中仅有一对前后值相同,影响也不大。
从直觉上讲,数据不应被忽略,因此普拉特的方法似乎更优。然而,科诺弗(3)已证明,这两种方法的相对优劣依赖于数据的底层分布,而您并不知道这一分布。
Prism 可以计算配对差值中位数的 95% 置信区间(在“选项”标签页中选择)。只有在假设差值的分布是对称的时,该结果才具有统计意义。Prism 6 及后续版本采用的方法详见 Sheskin(第四版)第 234-235 页和 Klotz 第 302-303 页。
使用配对检验的根本目的是控制实验变异性。实验中某些无法控制的因素会对“前”和“后”的测量值产生同等影响,因此不会影响“前”与“后”之间的差异。因此,通过仅分析差异值,配对检验可以校正这些导致数据散布的来源。
如果配对有效,则预期前后测量值应呈同步变化。 Prism 通过计算非参数斯皮尔曼相关系数 rs 来量化这一现象。基于 rs,Prism 计算出一个 P 值,该值回答了以下问题:如果两组之间确实完全不相关,那么随机选取的受试者出现与实验中观察到的相关系数大小相当(或更大)的概率是多少?该 P 值为单尾,因为您并不关注观察到强负相关性的可能性。
如果配对分析有效,rs 将为正值,且 P 值较小。这意味着两组之间存在显著相关性,因此选择配对检验是合理的。
如果 P 值较大(例如大于 0.05),您应质疑使用配对检验是否合理。是否采用配对检验的决策不应仅基于这个单一的 P 值,还应考虑实验设计以及您在其他类似实验中观察到的结果(假设您已重复进行了多次实验)。
如果 rs 为负值,则表明配对反而产生了反效果!您原本预期成对值应呈正相关 - 即一方较高时,另一方也较高。但此处情况恰恰相反 - 若一方数值较高,另一方数值则较低。这很可能是偶然现象。如果 rs 接近 -1,则应重新审查实验流程,因为数据表现异常。
Prism 6及后续版本的结果可能与早期版本不同,因为在Prism 5采用近似计算的两种情况下,Prism现在会进行精确计算。所有版本的Prism都会报告其采用的是近似方法还是精确方法。
•Prism 6 执行精确计算的速度远快于 Prism 5,因此对于某些样本量,它能进行精确计算,而 Prism 的早期版本只能进行近似计算。
•如果两组数据的“前后”差异相同,Prism 早期版本通常采用近似方法。Prism 6 则默认采用精确法,除非样本量极大。
Prism 会报告其采用的是近似方法还是精确法,因此很容易判断结果差异是否由此引起。
描述性统计的“分析”选项卡仅汇总了用于Wilcoxon检验的数据。若某列存在数据而另一列没有,则这些值不会包含在配对t检验附带的描述性统计结果中。当然,常规的描述性统计分析会分析所有数据。
1. Pratt JW (1959) 关于Wilcoxon符号秩检验中零值与并列值的评论。《美国统计协会杂志》,第 54 卷,第 287 期(1959 年 9 月),第 655-667 页
2. Pratt, J.W. 和 Gibbons, J.D. (1981),《非参数理论概念》,纽约:Springer Verlag。
3. W.J. 康诺弗,《关于Wilcoxon符号秩检验中处理并列值的方法》,《美国统计协会杂志》,第68卷,第344期(1973年12月),第985-988页