Please enable JavaScript to view this site.

Navigation: 使用 PRISM 进行统计分析 11 > 分类结果 > 列联表

结果解读:列联表的 P 值

Scroll Prev Top Next More

P值回答了什么问题?

Fisher检验或卡方检验得出的P值回答了以下问题:

如果在总体中,定义行(行变量)的变量与定义列(列变量)的变量之间确实不存在关联,那么通过随机抽样得到与本实验中观察到的关联强度相当(或更强)的关联,其概率是多少?

当数据包含两列且行数超过两行,且按自然顺序排列时,会进行趋势卡方检验。该方法也被称为科克伦-阿米蒂奇法。P值回答了以下问题:

如果行号与左列受试者比例之间不存在线性趋势,那么通过随机抽样恰好观察到如此强烈的趋势的概率是多少?

关于趋势卡方检验的更多信息,请参阅 D. G. Altman 所著的优秀教材《医学研究实用统计学》(Practical Statistics for Medical Research),该书由 Chapman and Hall 于 1991 年出版。

请记住,“统计学显著”并不等同于“科学上重要”

根据 P 值的大小不同,您对结果的解读也会有所不同。

为什么 P 值并不总是与置信区间一致?

P 值与置信区间是相互关联的。如果 P 值小于 0.05,那么 95% 的置信区间就不能包含定义零假设的值。(您可以针对 P 值 < 0.01 和 99% 的置信区间等制定类似的规则。)

但Prism软件基于列联表得出的结果并不总是遵循这一规则。

通过Fisher检验计算出的 P 值是完全正确的。然而,优势比和相对风险的置信区间是通过仅近似正确的方法计算的。因此,置信区间可能与 P 值并不完全一致。

例如,结果可能显示 P<0.05,但相对风险的 95% 置信区间却包含 1.0。(相对风险为 1.0 意味着无风险,因此定义了零假设)。同样地,您可能会发现 P>0.05,但 95% 置信区间却不包含 1.0。

这种表面上的矛盾很少发生,且通常出现在您输入的某个数值等于零时。

P值的计算方法

卡方检验的计算方法是标准的,所有统计学书籍中都有详细说明。

Fisher检验被称为“精确”检验,因此您可能会认为关于如何计算 P 值应该存在共识。事实并非如此!

虽然大家对单尾P值的计算方法达成一致,但实际上,从Fisher检验中计算“精确”双尾P值有三种方法。Prism采用“小P值求和法”来计算双尾P值。大多数统计学家似乎推荐这种方法,但有些程序采用不同的方法。

若想深入了解,SISA 提供了附有参考文献的详细讨论。另请参阅 Alan Agresti 所著《分类数据分析》中关于 Fisher检验的章节。这是一个极具争议的话题,这也解释了为何不同的统计学家(以及不同的软件公司)会采用不同的方法。

单侧 P 值

Prism 允许您选择报告单侧或双侧 P 值

在卡方检验中,单侧 P 值等于双侧 P 值的一半。《Zar***指出(第 503 页,第五版),存在一种极其罕见的情况,此时单侧 P 值可能会产生误导:即当您的实验设计同时选择了行总和与列总和时。

为何使用“单侧”而非“单尾”?为避免混淆。卡方检验值始终为正数。Prism 通过计算在零假设成立条件下,观察到该卡方检验值或更大值的概率来求得 P 值。因此,它仅考察卡方检验分布的右尾部分。 但当偏离零假设的方向不限(比例差为正或负,相对风险大于或小于1)时,卡方检验值仍可能很高。因此,双侧P值实际上是根据卡方检验分布的一侧计算得出的。  

在Fisher检验中,单侧 P 值的定义是明确无误的。但在大多数情况下,单侧 P 值并不等于双侧 P 值的一半。