Please enable JavaScript to view this site.

应报告的效应量

Prism 可以计算多种效应量,以帮助量化您的列联表中关联的强度。应选择哪种效应量取决于您的研究设计:

相对风险:表示某一组发生特定结果的可能性是另一组的多少倍(或低多少倍)。适用于前瞻性研究和实验性研究。

比例差(归因风险)与NNT:量化组间结局率的绝对差异。所需治疗人数(NNT)即该差异的倒数。适用于前瞻性及实验性研究。

优势比:比较不同组间发生某种结果的几率,是回顾性病例对照研究中不可或缺的指标。当结果发生率较低时,其数值近似于相对风险。

灵敏度、特异性和预测值:用于评估诊断试验的性能,衡量其正确识别真阳性和真阴性的能力。

Phi系数(φ)和克拉默系数(V):用于衡量列联表中关联的强度。Phi适用于2×2列联表,而克拉默系数(V)可推广至更大的列联表。适用于现况研究。

您可以选择多个效应量,以从不同角度呈现数据。

应选用哪种检验

如果您输入的是两行两列的数据,则必须选择卡方检验(有时称为卡方同质性检验或Fisher检验

卡方检验与Yates修正

在计算机尚未普及的年代,人们通常通过手工或使用计算器,借助卡方检验来分析列联表。该检验的原理是计算当相对风险(或优势比)为1.0时,每个单元格的期望值。随后,将观察值与期望值之间的偏差整合为卡方统计量,进而计算出P值。

卡方检验仅是一种近似方法。Yates修正旨在改善卡方近似,但其修正过度,导致得出的 P 值过大(过于“保守”)。当样本量较大时,Yates修正影响甚微,卡方检验效果极佳。当样本量较小时,无论是否采用Yates修正,卡方检验均不够精确。 统计学家们似乎对是否使用 Yates修正存在分歧。Prism 软件为您提供了选择。

如果观察值和期望值都非常接近(在0.25以内),Yates修正会产生某种反向作用,实际上会增加卡方检验值,从而降低P值,而不是像通常那样降低卡方检验值并提高P值。这种情况很少见,仅当相对风险或优势比非常接近1.0时才会发生。 若您要求进行Yates修正,即使在此情况下,Prism 也会执行Yates修正。

趋势卡方检验(也称为Cochran-Armitage法)适用于两列且行数超过两行、且数据按自然顺序排列的情况。 该检验并非简单地检验行与列之间是否存在关联,而是专门评估行位置与第一列中受试者比例之间是否存在线性趋势。当预期存在某种线性关系或其他有序的关联趋势时,这使得该检验比一般的卡方检验具有更高的检验力。

Fisher检验 - 对错误问题的精确答案?

正如其名,Fisher检验总能给出精确P值,且在小样本量下表现良好。Fisher检验(与卡方检验不同)很难手动计算,但用计算机计算却很简单。大多数统计学书籍建议使用它来代替卡方检验。  若您选择 Fisher检验,但数据量巨大,Prism 将自动覆盖您的选择并改用卡方检验,因为卡方检验在处理大样本量时非常精确。

顾名思义,Fisher检验无论使用何种样本量,都能给出完全正确的答案。但一些统计学家认为,Fisher检验给出的确切答案针对的是错误的问题,因此其结果也只是您真正想要的答案的近似值。问题在于,Fisher检验基于这样一种假设:行和列的总和是由实验确定的。 实际上,在前瞻性研究或实验的设计中,行总数(而非列总数)是固定的;在回顾性病例对照研究的设计中,列总数(而非行总数)是固定的;而在现况研究中,只有总体样本量(而非行或列总数)是固定的。 Ludbrook (1) 指出,Fisher 设计其精确检验是为了分析一种独特的实验,而这种实验设计极为罕见。

鉴于您的研究设计极不可能符合Fisher检验的限制条件,您可能会质疑:Fisher检验得出的精确P值是否真的能解答您心中所想的问题。

若输入巨大数值(总和大于1,000,000),即使选择了Fisher检验,Prism也会执行卡方检验。

Fisher检验的替代方案是巴纳德检验。据说Fisher检验是“依赖”于行和列总和的,而巴纳德检验则不然。Mehta 和 Senchaudhuri 解释了这一区别,以及为何巴纳德检验具有更高的检验力 (2)。Berger 对该检验进行了修改,使其更易于计算且检验力更强。  Ludbrook 讨论了适用于常见实验设计(1)的其他精确方法。

目前,我们暂不计划在Prism中实现巴纳德检验、伯杰检验或卢德布鲁克提及的精确检验(1)。显然,目前尚未形成关于这些检验方法更优的共识。

理解列联表分析中的P值

来自列联表分析的 P 值表明数据中观察到的关联是否统计学显著,但并不能说明该关联的“大小”或“强度”。效应量正是用于衡量这一程度的指标。虽然解读列联表分析的 P 值对于理解结果至关重要,但您还应结合上述讨论的效应量,以全面评估研究发现。

参考文献

1. Ludbrook, J. (2008). 2×2频率表的分析:检验方法与实验设计的匹配。《国际流行病学杂志》,37,1430–1435。

 

2. Mehta, C. R. 与 Senchaudhur, P., 《比较两个二项分布的条件与无条件精确二项式检验》。http://www.cytel.com/Papers/twobinomials.pdf