ROC曲线的全部意义在于帮助您决定如何划分“正常”与“不正常”的界限。如果所有对照组的数值都高于(或低于)所有患者组的数值,这个决定就很容易做出。然而,通常情况下,这两组分布会相互重叠,使得判断变得并不容易。
为了帮助您做出这一决策,Prism 会针对不同的阈值,对该检测的灵敏度和特异性进行数据汇总和图表展示。
敏感度:检测正确判定为阳性的患病人群比例。
特异性:检测正确判定为阴性的非患病人群所占的比例。
Prism 会将数据表中的每个数值作为阈值来计算灵敏度和特异性。这意味着它会计算出许多对灵敏度和特异性。如果您
Prism 以两种形式展示这些结果。标有“ROC”曲线的表格用于绘制“100% - 特异性%”与“敏感性%”的对比图。标有“灵敏度和特异性”的表格则列出了这些数值,并为正常与异常之间的每个可能阈值提供了相应的 95% 置信区间。
ROC曲线下面积被称为C统计量、一致性统计量或C指数。它量化了检测在区分患病个体与未患病个体方面的总体能力。 一个真正无用的检测(其识别真阳性的能力甚至不如抛硬币)的面积为0.5。一个完美的检测(即零假阳性且零假阴性)的面积为1.00。您的检测结果将介于这两个值之间。即使您选择以百分比形式绘制结果,Prism仍会以分数形式报告该面积。
Prism 会计算整个 AUC 曲线下面积,起始点为 (0,0),终点为 (100,100)。请注意,无论您是否要求 Prism 将 ROC 曲线绘制到这些极限点,它都会计算整条曲线的下面积。
虽然曲线下面积显然与检测区分正常与异常的总体能力相关,但如何解读该面积本身却并不那么直观。不过,有一种非常直观的解释。
如果患者的检验值高于对照组,那么:
该面积代表随机选取的一名患者其检测结果高于随机选取的一名对照组的概率。
如果患者的检测结果往往低于对照组:
该面积代表随机选取的一名患者检测结果低于随机选取的一名对照组的概率。
例如:若面积值为0.80,则平均而言,患者的检测结果比80%的对照组更异常。若检测完美,每位患者的检测结果都将比每位对照组更异常,此时面积值应为1.00。
如果该检测毫无价值,其区分正常与异常的能力仅与随机猜测相当,那么预计一半的对照组检验值会高于已知患病的患者,另一半则会低于患者。因此,曲线下的面积将为 0.5。
ROC曲线下面积绝不会小于0.50。如果初次计算出的面积小于0.50,Prism将把“异常”的定义从“检验值较高”反转为“检验值较低”。这一调整将导致ROC曲线下面积大于0.50。
Berrar 指出,ROC 曲线的解读必须谨慎,其解读远不止于观察 AUC(1)。
Prism 还会报告 ROC曲线下面积的标准误差以及 95% 置信区间。这些结果通过一种非参数方法计算得出,该方法对患者组和对照组检测结果的分布不作任何假设。
置信区间的解读非常直观。如果患者组和对照组代表了更大总体中的随机抽样,则可以95%的置信度认为该置信区间包含真实面积。
Prism 通过报告 P 值来完善 ROC 曲线评估,该 P 值用于检验“ROC曲线下面积确实等于 0.50”这一零假设。换言之,P 值回答了以下问题:
如果该检测的诊断效果与抛硬币无异,那么 ROC曲线下面积有何种概率会达到(或超过)您观察到的数值?
如果 P 值较小(通常确实如此),则可得出结论:该检测确实能区分异常患者与正常对照组。
如果 P 值较大,则意味着您的诊断试验在诊断患者方面并不比抛硬币更准确。可以推测,在确信试验确实能诊断出该疾病之前,您不会收集足够的数据来绘制 ROC 曲线,因此高 P 值的情况应该非常罕见。
| 1. | Berrar D, Flach P. 临床微阵列研究中ROC分析的注意事项与陷阱(及如何规避)。《生物信息学简报》。牛津大学出版社;2011年3月21日;13(1):bbr008–97。 |