通常,逻辑回归的目标只是将观测值归类为模型所描述的两种可能结果之一。我们已经讨论过,如何根据一组独立变量(X)的值来计算“成功”(Y=1)的概率。分类是通过使用该预测概率并应用以下规则集来实现的:
1.定义一个阈值(介于0和1之间)
2.确定观察值的成功概率,并与阈值进行比较
3.若计算出的概率大于阈值,则将观察值归类为成功;若计算出的概率小于阈值,则将观察值归类为失败
Prism 提供了两种基于逻辑模型对数据进行分类后报告结果的方法。它们包括 ROC曲线下面积 (AUC) 和 2x2 分类表,具体说明如下。
ROC曲线下面积(AUC)提供了一个综合指标,反映模型在所有可能的阈值下正确分类0和1的性能。AUC值范围在0.5到1之间,其中0.5表示模型预测结果为1或0的准确度不高于抛硬币,1表示模型预测完全准确。 要更详细地理解报告的AUC值,请查看逻辑回归中ROC曲线各种极端情况的示例。
分类表呈现一个 2x2 表格,显示在用户指定的分类临界值下正确分类的值。该表包含四个条目,分别报告被正确(和错误)预测的观察值(即 0 和 1)的数量。 此外,分类表还将提供以下信息:观测到的 1 和 0 的总数、预测的 1 和 0 的总数、正确分类的 1 和 0 的百分比、正确分类观测值的总百分比,以及阳性检验力和阴性检验力。
•观测(输入)的0的总数 = A + B
•观测(输入)的1的总数 = C + D
•预测的0的总数 = A + C
•预测的1的总数 = B + D
•观测到的0被正确分类的百分比 = (A/(A+B))*100
•观测到的 1 被正确分类的百分比 = (D/(C+D))*100
•所有观测值正确分类的百分比 = ((A+D)/(A+B+C+D))*100
•阴性检验力(%)= (A/(A+C))*100
•阳性预测检验力(%)= (D/(B+D))*100
|
预测为0 |
预测为1 |
观察值 0 |
A |
B |
观测值 1 |
C |
D |
分类表中还可以获得许多 Prism 未直接报告的其他指标。例如,从这类数据中常可得出的指标包括错误发现率(B/(B+D))、假阴性率(C/(C+D))等。如需了解更多信息,请阅读关于可从分类表计算出的指标的详细说明。
另请注意,两个常见指标 - 灵敏度和特异性 - 也可通过分类表计算得出。对于所选的阈值(默认值为 0.5),可根据分类表中的数值按以下公式计算灵敏度和特异性:
灵敏度 = D/(C+D)
特异性 = A/(A+B)
Prism 在“正确分类百分比”列中报告这些指标。“观察到的 1 被正确分类的百分比”即为敏感度,“观察到的 0 被正确分类的百分比”即为特异性。Prism 以百分比形式报告这些指标。