在评估模型时,一个合理的问题可能是:“该模型在对数据中观察到的0和1进行分类时表现如何?”
逻辑回归计算得到“阳性”结果(在数据表中编码为1)的概率。若要使用逻辑回归预测新观测值是“阳性”还是“阴性”,需指定一个阈值,该阈值代表被视为“阳性”所需的最低概率。 标准阈值为0.5,这意味着如果预测概率大于0.5,则该观察值被分类为“阳性”(或简称为1)。既然我们已经理解了阈值的含义,接下来让我们看看Prism提供的三种分类方法。
ROC曲线下面积(AUC)提供了一个综合指标,反映模型在所有可能的阈值下正确分类0和1的性能。AUC值范围在0.5到1之间,其中0.5表示模型预测结果为1或0的准确性与抛硬币无异,而1表示模型预测完全准确。 以下提供了一些逻辑回归中ROC曲线的各种极端情况示例。
分类表呈现一个 2x2 表格,显示在用户指定的分类临界值下正确分类的数值。该表包含四个条目,分别报告被正确(和错误)预测的观察值(0 和 1)的数量。 此外,分类表还将提供以下信息:观测到的 1 和 0 的总数、预测的 1 和 0 的总数、正确分类的 1 和 0 的百分比、总观测值中正确分类的百分比,以及阳性检验力和阴性检验力。详情。
“行分类”将生成一个包含两列的附加表格。第一列包含数据表中选定自变量(Y)列值的副本。第二列包含模型生成的预测概率,这些概率对应于第一列中的每个条目(每行)。