Please enable JavaScript to view this site.

P值

Friedman检验是一种非参数检验,用于比较三个或更多匹配组或成对组。该检验首先将每个匹配组(每行)中的数值从低到高进行排序。每行均单独排序。随后,将各组(列)的秩和相加。如果各组的秩和差异显著,则 P 值将较小。 Prism 报告弗里德曼统计量的数值,该值由秩和及样本量计算得出。该值有多种名称。某些程序和文献将其称为 Q、T1 或 FM;另一些则称其为卡方检验,因为其分布近似于卡方检验分布,因此使用卡方检验分布来计算 P 值。

采用配对检验的核心目的在于控制受试者间的实验变异性,从而提高检验的检验力。实验中某些无法控制的因素会导致某位受试者的所有测量值同时增加(或减少)。由于Friedman检验是对每一行中的数值进行排序,因此它不受那些对行内所有数值产生同等影响的变异源的影响(因为该因素不会改变行内的排序)。

P值回答了这个问题:如果不同的处理组(列)确实完全相同,那么随机抽样导致其秩和差异达到(或超过)本实验中观察到的程度,其概率是多少?

如果 P 值较小,则可以拒绝“各列之间的所有差异均由随机抽样引起”这一假设,并得出结论:至少有一种处理方式(列)与其他处理方式不同。随后查看后检验结果,以确定哪些组与其他组存在差异。

如果 P 值较大,数据无法支持“总体中位数存在差异”的结论。这并不等同于说中位数相同,只是目前没有充分证据表明它们存在差异。如果样本量较小,Friedman检验的检验力会很低。

精确P值还是近似P值?

对于规模较小的数据表,Prism 会进行精确计算。当数据表较大时,Prism 会采用标准近似方法。为了决定何时使用近似方法,Prism 会计算 (T!)S(T 的 S 次幂),其中 T 代表处理组(数据集)的数量,S 代表受试者(行)的数量。当该值超过 109 时,Prism 便采用近似方法。 例如,若存在 3 个处理组和 12 行数据,则 (T!)S 等于 612,即 2.2 × 10,因此 Prism 将采用近似方法。

近似方法有时也被称为高斯近似法。术语“高斯”与秩和分布有关,并不意味着您的数据必须来自高斯分布。对于中等规模的样本量,Prism 计算精确P值可能需要很长时间。如果近似P值已满足您的需求,您可以中断计算。

精确法的工作原理是考察所有可能的数值重新排列方式,保持每个数值位于同一行(同一受试者,因为这是重复测量设计),但允许列(处理)的分配发生变化。

如果两个或多个值(在同一行内)相同,Prism 的早期版本无法计算精确P值,因此即使样本量很小,Prism 也会计算近似P值。Prism 6 及更高版本即使存在并列情况也能计算精确P值,因此如上所述,仅在样本量相当大时才会使用近似值。这意味着对于某些数据集,Prism 报告的结果将与旧版本不同。

Dunn后检验

在 Friedman检验之后,Prism 可以执行Dunn后检验。详情请参阅 WW Daniel 所著的《应用非参数统计学》(PWS-Kent 出版社,1990 年)或 S Siegel 和 NJ Castellan 合著的《行为科学非参数统计学》(1988 年)。原始参考文献为 O.J. Dunn,《Technometrics》,5:241-252,1964 年。 请注意,有些书籍和程序仅将此检验称为Friedman检验后的后检验,并未给出确切名称。

Dunn后检验将两列数据间秩和的差异与预期平均差异(基于组数及其样本量)进行比较。对于每一对列,Prism会报告P值为>0.05、<0.05、<0.01或<0.001。P值的计算会考虑您所进行的比较次数。 如果零假设成立(所有数据均采样自具有相同分布的总体,因此组间所有差异均源于随机抽样),则至少有一项后检验的 P 值小于 0.05 的概率为 5%。该 5% 的概率并非针对每次比较,而是针对比较族。