GraphPad Prism 11 Statistics Guide - 结果解读：Kolmogorov-Smirnov 检验

Zoom Window Out
Larger Text | Smaller Text
Hide Page Header
Show Expanding Text
Printable Version
Save Permalink URL

Navigation: 使用 PRISM 进行统计分析 11 > t 检验、Mann-Whitney 检验与 Wilcoxon 配对检验 > Mann-Whitney 检验与 Kolmogorov-Smirnov 检验

结果解读：Kolmogorov-Smirnov 检验

关于Kolmogorov-Smirnov检验的关键事实

•双样本Kolmogorov-Smirnov检验是一种非参数检验，用于比较两个数据集的累积分布(1,2)。

•该检验属于非参数检验。它不假设数据是从高斯分布（或任何其他已定义的分布）中抽样的。

•即使将所有数值转换为对数、倒数或进行任何其他变换，结果也不会改变。KS检验报告两个累积分布之间的最大差异，并据此结合样本量计算出P值。变换会拉伸（若选择奇特的变换甚至会重新排列）频率分布的X轴，但无法改变两个频率分布之间的最大距离。

•将所有数值转换为序数也不会改变累积频率分布之间的最大差异（参见Lehmann著作第35-36页，参考文献2）。因此，尽管该检验分析的是实际数据，但其等同于对序数的分析。因此，该检验对异常值具有相当强的鲁棒性（类似于Mann-Whitney检验）。

•零假设是两个组均来自具有相同分布的总体。该检验用于检测是否违反零假设 - 即中位数不同、方差不同或分布不同。

•由于该检验检测的偏离零假设的情况比Mann-Whitney检验更多，因此其检测中位数偏移的能力较弱，但检测分布形状变化的检验力更强（Lehmann，第39页）。

•由于该检验不比较任何特定参数（即均值或中位数），因此不报告任何置信区间。

• 如果因变量（Y值）是分类型且存在大量并列值，请勿使用Kolmogorov-Smirnov检验。仅将其用于比值或间隔型数据，因为此类数据中并列值很少见。

•单尾P值和双尾P值的概念仅在分析具有两种可能方向的结果（即两个均值之间的差异）时才有意义。两个累积分布可能在许多方面存在差异，因此“尾部”的概念并不完全适用。Prism 报告的 P 值本质上具有多重尾部。有些文献将此称为双尾P值。

P值的解读

P值是对以下问题的回答：

如果这两个样本是从相同的总体中随机抽样的，那么两个累积频率分布相差如观测到的那么大的概率是多少？更精确地说，科莫戈罗夫-斯米尔诺夫 D 统计量的值不小于观测值（即达到或超过观测值）的概率是多少？

若 P 值较小，则可推断两组样本来自分布不同的总体。这些总体在中位数、变异性或分布形状上可能存在差异。

绘制累积频率分布图

KS检验通过比较两个频率分布来工作，但它不会绘制这些频率分布。要绘制这些频率分布，请返回数据表，点击“分析”，然后选择“频率分布分析”。选择创建累积频率分布并列出相对频率。

请勿与 KS 正态性检验混淆

人们很容易将双样本Kolmogorov-Smirnov检验（用于比较两组数据）与单样本Kolmogorov-Smirnov检验混淆，后者也称为Kolmogorov-Smirnov拟合优度检验，用于检验单个分布是否与理论预期存在显著差异。

单样本检验通常用作正态性检验，用于将单个数据集中的数据分布与高斯分布的预测值进行比较。Prism 将此正态性检验作为“列统计”分析的一部分进行。

与Mann-Whitney检验的比较

Mann-Whitney检验也是一种用于比较两个非配对组别的非参数检验。该检验通过将所有数值从低到高排序，并比较两组中数值的平均秩来工作。

Prism 如何计算 P 值

Prism 首先生成两个累积相对频率分布，然后计算这两个频率分布在距离最远处之间的距离。Prism 采用 Lehmann (2) 阐述的方法。该距离被报告为 Kolmogorov-Smirnov D。

P 值是根据频率分布之间的最大距离计算得出的，同时考虑了两组的样本量。对于较大样本，会采用一种非常精确的近似方法（2, 3）。

当样本较小时采用精确法，Prism 将其定义为：当从 n1+n2 个值中选取 n1 个值的排列数少于 60,000 时，其中 n1 和 n2 分别为两个样本的样本量。因此，对于以下组规模组合将采用精确检验（括号中的两个数字分别表示两组的样本量）：

(2, 2), (2, 3) ... (2, 346)

(3, 3), (3, 4) ... (3, 69)

(4, 4), (4, 5) ... (4, 32)

(5, 5), (5, 6) ... (5, 20)

(6, 6), (6, 7) ... (6, 15)

(7, 7), (7, 8) ... (7, 12)

(8, 8), (8, 9), (8, 10)

(9, 9)

Prism在其精确算法（内部开发）中考虑了平局情况。它会系统地在两个组之间重新洗牌实际数据（保持样本量不变）。它报告的P值是：在这些重新洗牌的数据集中，根据重新洗牌的数据集计算出的D值大于或等于根据实际数据集计算出的D值的数据集所占的比例。

参考文献

1. Kirkman, T.W. (1996) 《实用统计学：Kolmogorov-Smirnov检验》。（访问于 2010 年 2 月 10 日）

2. Lehmann, E. (2006), 《非参数统计：基于秩的统计方法》。ISBN: 978-0387352121

3. WH Press 等，《数值配方》，第三版，剑桥大学出版社，ISBN: 0521880688

Please enable JavaScript to view this site.