Please enable JavaScript to view this site.

灵敏度和特异性

ROC 曲线的全部意义在于帮助您确定"正常"与"不正常"之间的界限。如果所有对照组的值都高于(或低于)所有患者的值,则很容易做出决定。但通常情况下,这两种分布会重叠,因此并不那么容易。如果阈值较高,就不会误诊许多未患病者,但会漏诊一些患病者。如果把阈值设得低一些,就能正确识别所有(或几乎所有)患病者,但也会诊断出更多未患病者。

为了帮助您做出这一决定,Prism 将检验在不同临界值下的灵敏度和特异性列表并绘制成图。

灵敏度: 试验正确识别为阳性的患病者比例。

特异性:试验正确识别为阴性的无疾病人群的比例。

Prism 使用数据表中的每个值作为临界值来计算灵敏度和特异性。这意味着它会计算出许多对灵敏度和特异性。如果选择较高的临界值,就会增加检验的特异性,但会损失灵敏度。如果阈值较低,则会增加检验的灵敏度和特异性,但会失去特异性。

Prism 会以两种形式显示这些结果。标有"ROC"曲线的表格用于绘制 100% 特异性% 与灵敏度% 的对比图。标有"灵敏度和特异性"的表格列出了这些值及其在正常和异常之间每个可能分界点的 95% 置信区间。

面积(C 统计量)

ROC 曲线下的面积称为C 统计量、  一致性 统计量 C 指数。 它量化了检验区分有病和无病个体的整体能力。一个真正无用的试验(在鉴别真阳性方面并不比掷硬币好)的面积为 0.5。完美试验(假阳性和假阴性均为零)的面积为 1.00。您的检验值将介于这两个值之间。即使您选择将结果绘制为百分比,Prism 也会将面积报告为分数。

Prism 计算整个 AUC 曲线下的面积,从 0,0 开始,到 100,100 结束。请注意,无论您是否要求 Prism 将 ROC 曲线绘制到这些极值,它都会计算整条曲线的面积。

很明显,曲线下的面积与检验正确识别正常与异常的整体能力有关,但如何解读面积本身却不那么明显。不过,有一种非常直观的解读。

如果患者的检验值高于对照组,那么:

该区域代表随机抽取的患者的检测结果高于随机抽取的对照组的概率。

如果患者的检测结果往往低于对照组:

该区域表示随机抽取的患者的检测结果低于随机抽取的对照组的概率。

本示例举例说明:如果面积等于 0.80,平均而言,一名患者的检测结果将比 80% 的对照组更不正常。如果测试是完美的,那么每个患者的测试结果都会比每个对照组更不正常,面积就等于 1.00。

如果检验毫无价值,在鉴别正态性与异常性方面并不比偶然性更好,那么人们期望一半的对照组的检验值会比已知患病的患者高,一半的对照组的检验值会比已知患病的患者低。因此,曲线下面积为 0.5。

ROC 曲线下面积绝对不能小于 0.50。如果首先计算出的面积小于 0.50,Prism 就会将异常的定义从较高检验值逆转为较低检验值。这一调整将使曲线下的面积大于 0.50。

Berrar 指出,ROC 曲线的解读必须谨慎,除了看 AUC 之外,还有更多的解读方法(1)。

面积的标准误差和置信区间

Prism 还会报告 ROC 曲线下面积的标准误差以及 95% 置信区间。这些结果是通过非参数方法计算得出的,不对患者组和对照组的测试结果分布做任何假设。

解读置信区间非常简单。如果患者组和对照组代表了更大人群的随机抽样,则可以 95% 地确定置信区间包含了真实的面积。

P 值

Prism 通过报告 P 值来完成 ROC 曲线评估,该 P 值检验了曲线下面积是否真的等于 0.50 的零假设。换句话说,P 值回答了这个问题:

如果测试诊断出的疾病没有掷硬币好,那么 ROC 曲线下面积与您观察到的一样高(或更高)的概率有多大?

如果您的 P 值很小(通常会很小),您可能会得出结论:您的检验实际上确实能区分异常患者和正常对照组。

如果 P 值很大,则意味着你的诊断试验并不比掷硬币诊断病人好多少。据推测,在确定您的检验确实能诊断疾病之前,您不会收集足够的数据来绘制 ROC 曲线,因此高 P 值应该很少出现。

BerrarD, Flach P. Caveats and pitfalls of ROC analysis in clinical microarray research (and how to avoid them).Brief Bioinform.牛津大学出版社;2011 年 3 月 21 日;13(1):bbr008-97。

© 1995-2019 GraphPad Software, LLC. All rights reserved.