Kruskal-Wallis检验是一种用于比较三个或更多个非配对组的非参数检验。进行此检验时,Prism 首先将所有数值按从小到大的顺序进行排序,而不考虑每个数值属于哪个组。最小的数值被赋予第 1 位,最大的数值被赋予第 N 位,其中 N 是所有组中数值的总数。 将各组秩和之间的差异综合起来,形成一个称为克鲁斯卡尔-瓦利斯统计量(Kruskal-Wallis statistic)的单一数值(有些书籍将该数值称为 H)。较大的克鲁斯卡尔-瓦利斯统计量对应于各组秩和之间较大的差异。
P值回答了以下问题:
若样本量较小(即使存在并列情况),Prism将计算精确P值。若样本量较大,则基于高斯近似法估算P值(因为Kruskal-Wallis统计量H近似服从卡方检验分布)。Prism会相应地将P值标注为精确值或近似P值。 此处“高斯”一词与秩和的分布有关,并不意味着您的数据必须服从高斯分布。该近似方法在大样本情况下非常精确,且是标准做法(所有统计软件均采用)。 对于较大的数据集或性能较弱的计算机,精确计算可能较为耗时。此时,您可以通过点击进度对话框中的“取消”按钮来中止计算。若取消精确P值的计算,Prism将显示近似P值。
若 P 值较小,则可驳斥差异源于随机抽样的假设,进而得出总体分布不同的结论。
如果 P 值较大,则数据无法支持“分布存在差异”的结论。这并不等同于说分布是相同的。Kruskal-Wallis检验的检验力较弱。事实上,如果总样本量为 7 或更少,无论组间差异有多大,Kruskal-Wallis检验给出的 P 值总是大于 0.05。
Kruskal-Wallis检验是为连续尺度数据设计的。因此,通常预期每个测量值都是唯一的。但偶尔会出现两个或多个值相等的情况。当Kruskal-Wallis检验将数值转换为秩时,这些值将并列同一秩,因此它们都被赋予其并列的两个(或多个)秩的平均值。
Prism 在计算克鲁斯卡尔-瓦利斯统计量时,采用标准方法对并列情况进行校正。
当存在并列情况时,尚无完全标准的方法可从这些统计量中获得 P 值。Prism 6 及后续版本处理并列情况的方式与早期版本不同。在样本量适中的情况下,Prism 将计算精确P值。早期版本在出现并列时总是计算近似P值。因此,在存在并列的情况下,Prism 6 及后续版本报告的 P 值可能与早期版本的 Prism 或其他程序报告的 P 值不同。
若样本量较小,Prism 将计算精确P值;若样本量较大,则根据卡方检验近似计算 P 值。在大样本情况下,该近似P值非常精确。在中等样本量下,Prism 计算精确P值可能需要较长时间。计算过程中,Prism 会显示进度对话框,若近似P值已能满足您的需求,可点击“取消”中断计算。 Prism 始终会报告 P 值是通过精确计算还是近似计算得出的。
Dunn检验
Dunn多重比较检验将两列间秩和的差值与预期平均差值(基于组数及其规模)进行比较。
对于每一对列,Prism 会报告 P 值大于 0.05、小于 0.05、小于 0.01 或小于 0.001。P 值的计算会考虑您进行的比较次数。 如果零假设成立(所有数据均采样自具有相同分布的总体,因此组间所有差异均源于随机抽样),则至少有一项后检验的 P 值小于 0.05 的概率为 5%。该 5% 的概率并非针对每次比较,而是针对整个比较族。
有关后检验的更多信息,请参阅 W.W. Daniel 所著《应用非参数统计学》(PWS-Kent 出版社,1990 年)或 S. Siegel 与 N.J. Castellan 合著的《行为科学非参数统计学》(1988 年)。原始参考文献为 O.J. Dunn,《技术计量学》第 5 卷,第 241-252 页,1964 年。
Prism将该后检验称为“Dunn后检验”。有些书籍和程序仅将其称为“Kruskal-Wallis检验之后的后检验”,并未给出确切名称。
在解释结果之前,请查阅分析核查清单。