GraphPad Prism 11 Statistics Guide - 列联表分析的选项

Zoom Window Out
Larger Text | Smaller Text
Hide Page Header
Show Expanding Text
Printable Version
Save Permalink URL

Navigation: 使用 PRISM 进行统计分析 11 > 分类结果 > 列联表

列联表分析的选项

Scroll Prev Top Next More

应报告的效应量

Prism 可以计算多种效应量，以帮助量化您的列联表中关联的强度。应选择哪种效应量取决于您的研究设计：

•相对风险：表示某一组发生特定结果的可能性是另一组的多少倍（或低多少倍）。适用于前瞻性研究和实验性研究。

•比例差（归因风险）与NNT：量化组间结局率的绝对差异。所需治疗人数（NNT）即该差异的倒数。适用于前瞻性及实验性研究。

•优势比：比较不同组间发生某种结果的几率，是回顾性病例对照研究中不可或缺的指标。当结果发生率较低时，其数值近似于相对风险。

•灵敏度、特异性和预测值：用于评估诊断试验的性能，衡量其正确识别真阳性和真阴性的能力。

•Phi系数（φ）和克拉默系数（V）：用于衡量列联表中关联的强度。Phi适用于2×2列联表，而克拉默系数（V）可推广至更大的列联表。适用于现况研究。

您可以选择多个效应量，以从不同角度呈现数据。

应选用哪种检验

如果您输入的是两行两列的数据，则必须选择卡方检验（有时称为卡方同质性检验）或Fisher检验。

卡方检验与Yates修正

在计算机尚未普及的年代，人们通常通过手工或使用计算器，借助卡方检验来分析列联表。该检验的原理是计算当相对风险（或优势比）为1.0时，每个单元格的期望值。随后，将观察值与期望值之间的偏差整合为卡方统计量，进而计算出P值。

卡方检验仅是一种近似方法。Yates修正旨在改善卡方近似，但其修正过度，导致得出的 P 值过大（过于“保守”）。当样本量较大时，Yates修正影响甚微，卡方检验效果极佳。当样本量较小时，无论是否采用Yates修正，卡方检验均不够精确。统计学家们似乎对是否使用 Yates修正存在分歧。Prism 软件为您提供了选择。

如果观察值和期望值都非常接近（在0.25以内），Yates修正会产生某种反向作用，实际上会增加卡方检验值，从而降低P值，而不是像通常那样降低卡方检验值并提高P值。这种情况很少见，仅当相对风险或优势比非常接近1.0时才会发生。若您要求进行Yates修正，即使在此情况下，Prism 也会执行Yates修正。

趋势卡方检验（也称为Cochran-Armitage法）适用于两列且行数超过两行、且数据按自然顺序排列的情况。该检验并非简单地检验行与列之间是否存在关联，而是专门评估行位置与第一列中受试者比例之间是否存在线性趋势。当预期存在某种线性关系或其他有序的关联趋势时，这使得该检验比一般的卡方检验具有更高的检验力。

Fisher检验 - 对错误问题的精确答案？

正如其名，Fisher检验总能给出精确P值，且在小样本量下表现良好。Fisher检验（与卡方检验不同）很难手动计算，但用计算机计算却很简单。大多数统计学书籍建议使用它来代替卡方检验。若您选择 Fisher检验，但数据量巨大，Prism 将自动覆盖您的选择并改用卡方检验，因为卡方检验在处理大样本量时非常精确。

顾名思义，Fisher检验无论使用何种样本量，都能给出完全正确的答案。但一些统计学家认为，Fisher检验给出的确切答案针对的是错误的问题，因此其结果也只是您真正想要的答案的近似值。问题在于，Fisher检验基于这样一种假设：行和列的总和是由实验确定的。实际上，在前瞻性研究或实验的设计中，行总数（而非列总数）是固定的；在回顾性病例对照研究的设计中，列总数（而非行总数）是固定的；而在现况研究中，只有总体样本量（而非行或列总数）是固定的。 Ludbrook (1) 指出，Fisher 设计其精确检验是为了分析一种独特的实验，而这种实验设计极为罕见。

鉴于您的研究设计极不可能符合Fisher检验的限制条件，您可能会质疑：Fisher检验得出的精确P值是否真的能解答您心中所想的问题。

若输入巨大数值（总和大于1,000,000），即使选择了Fisher检验，Prism也会执行卡方检验。

Fisher检验的替代方案是巴纳德检验。据说Fisher检验是“依赖”于行和列总和的，而巴纳德检验则不然。Mehta 和 Senchaudhuri 解释了这一区别，以及为何巴纳德检验具有更高的检验力 (2)。Berger 对该检验进行了修改，使其更易于计算且检验力更强。 Ludbrook 讨论了适用于常见实验设计（1）的其他精确方法。

目前，我们暂不计划在Prism中实现巴纳德检验、伯杰检验或卢德布鲁克提及的精确检验（1）。显然，目前尚未形成关于这些检验方法更优的共识。

理解列联表分析中的P值

来自列联表分析的 P 值表明数据中观察到的关联是否统计学显著，但并不能说明该关联的“大小”或“强度”。效应量正是用于衡量这一程度的指标。虽然解读列联表分析的 P 值对于理解结果至关重要，但您还应结合上述讨论的效应量，以全面评估研究发现。

参考文献

1. Ludbrook, J. (2008). 2×2频率表的分析：检验方法与实验设计的匹配。《国际流行病学杂志》，37，1430–1435。

2. Mehta, C. R. 与 Senchaudhur, P., 《比较两个二项分布的条件与无条件精确二项式检验》。http://www.cytel.com/Papers/twobinomials.pdf

Please enable JavaScript to view this site.