Please enable JavaScript to view this site.

关于Kolmogorov-Smirnov检验的关键事实

双样本Kolmogorov-Smirnov检验是一种非参数检验,用于比较两个数据集的累积分布(1,2)。

该检验属于非参数检验。它不假设数据是从高斯分布(或任何其他已定义的分布)中抽样的。

即使将所有数值转换为对数、倒数或进行任何其他变换,结果也不会改变。KS检验报告两个累积分布之间的最大差异,并据此结合样本量计算出P值。变换会拉伸(若选择奇特的变换甚至会重新排列)频率分布的X轴,但无法改变两个频率分布之间的最大距离。

将所有数值转换为序数也不会改变累积频率分布之间的最大差异(参见Lehmann著作第35-36页,参考文献2)。因此,尽管该检验分析的是实际数据,但其等同于对序数的分析。因此,该检验对异常值具有相当强的鲁棒性(类似于Mann-Whitney检验)。

零假设是两个组均来自具有相同分布的总体。该检验用于检测是否违反零假设 - 即中位数不同、方差不同或分布不同。

由于该检验检测的偏离零假设的情况比Mann-Whitney检验更多,因此其检测中位数偏移的能力较弱,但检测分布形状变化的检验力更强(Lehmann,第39页)。

由于该检验不比较任何特定参数(即均值或中位数),因此不报告任何置信区间。

如果因变量(Y值)是分类型且存在大量并列值,请勿使用Kolmogorov-Smirnov检验。仅将其用于比值或间隔型数据,因为此类数据中并列值很少见。  

单尾P值和双尾P值的概念仅在分析具有两种可能方向的结果(即两个均值之间的差异)时才有意义。两个累积分布可能在许多方面存在差异,因此“尾部”的概念并不完全适用。Prism 报告的 P 值本质上具有多重尾部。有些文献将此称为双尾P值。

P值的解读

P值是对以下问题的回答:

如果这两个样本是从相同的总体中随机抽样的,那么两个累积频率分布相差如观测到的那么大的概率是多少?更精确地说,科莫戈罗夫-斯米尔诺夫 D 统计量的值不小于观测值(即达到或超过观测值)的概率是多少?

若 P 值较小,则可推断两组样本来自分布不同的总体。这些总体在中位数、变异性或分布形状上可能存在差异。

绘制累积频率分布图

KS检验通过比较两个频率分布来工作,但它不会绘制这些频率分布。要绘制这些频率分布,请返回数据表,点击“分析”,然后选择“频率分布分析”。选择创建累积频率分布并列出相对频率。  

请勿与 KS 正态性检验混淆

人们很容易将双样本Kolmogorov-Smirnov检验(用于比较两组数据)与单样本Kolmogorov-Smirnov检验混淆,后者也称为Kolmogorov-Smirnov拟合优度检验,用于检验单个分布是否与理论预期存在显著差异。

单样本检验通常用作正态性检验,用于将单个数据集中的数据分布与高斯分布的预测值进行比较。Prism 将此正态性检验作为“列统计”分析的一部分进行。  

与Mann-Whitney检验的比较

Mann-Whitney检验也是一种用于比较两个非配对组别的非参数检验。该检验通过将所有数值从低到高排序,并比较两组中数值的平均秩来工作。

Prism 如何计算 P 值

Prism 首先生成两个累积相对频率分布,然后计算这两个频率分布在距离最远处之间的距离。Prism 采用 Lehmann (2) 阐述的方法。该距离被报告为 Kolmogorov-Smirnov D

P 值是根据频率分布之间的最大距离计算得出的,同时考虑了两组的样本量。对于较大样本,会采用一种非常精确的近似方法(2, 3)。

当样本较小时采用精确法,Prism 将其定义为:当从 n1+n2 个值中选取 n1 个值的排列数少于 60,000 时,其中 n1 和 n2 分别为两个样本的样本量。因此,对于以下组规模组合将采用精确检验(括号中的两个数字分别表示两组的样本量):

(2, 2), (2, 3) ... (2, 346)

(3, 3), (3, 4) ... (3, 69)

(4, 4), (4, 5) ... (4, 32)

(5, 5), (5, 6) ... (5, 20)

(6, 6), (6, 7) ... (6, 15)

(7, 7), (7, 8) ... (7, 12)

(8, 8), (8, 9), (8, 10)

(9, 9)

Prism在其精确算法(内部开发)中考虑了平局情况。它会系统地在两个组之间重新洗牌实际数据(保持样本量不变)。它报告的P值是:在这些重新洗牌的数据集中,根据重新洗牌的数据集计算出的D值大于或等于根据实际数据集计算出的D值的数据集所占的比例。

参考文献

1. Kirkman, T.W. (1996) 《实用统计学:Kolmogorov-Smirnov检验》。(访问于 2010 年 2 月 10 日)

2. Lehmann, E. (2006), 《非参数统计:基于秩的统计方法》。ISBN: 978-0387352121

3. WH Press 等,《数值配方》,第三版,剑桥大学出版社,ISBN: 0521880688