Prism 提供了四个伪R平方值。在评估这些值时,必须注意它们不能像线性回归中的 R 平方那样进行解读。起初这可能会让人感到困惑,因为尽管它们提供的模型信息不同,但它们的设计初衷是与这一常用指标存在某些相似之处,例如它们的取值范围都限制在 0 到 1 之间。
Tjur 的 R 平方具有一个直观且极具吸引力的定义。对于数据表中所有观测到的 0,计算其预测值的均值;同样,对于数据表中所有观测到的 1,计算其预测值的均值。 Tjur's R平方即这两个均值之间的距离(即差值的绝对值)。因此,Tjur's R平方值接近1表明0和1的预测值之间存在明显区分。此外,Tjur's R平方(与线性回归中的R平方类似)实际上取值范围在0到1之间。
Tjur's R² = |0 的平均预测值 – 1 的平均预测值|
McFadden(以及Cox-Snell和Nagelkerke)的R²是通过似然函数计算得出的。本指南的模型诊断部分简要讨论了似然和对数似然的概念。不过,要理解这种伪R平方指标所传达的信息,并不需要深入了解对数似然的具体计算方法。 简而言之,似然函数(及对数似然)可反映模型与数据的拟合程度。麦克法登R²通过计算指定模型与仅截距模型的对数似然比,并将其从1中减去来得出。换言之:
McFadden R² = 1 – (指定模型的对数似然值 / 仅截距模型的对数似然值)
如果指定模型与数据拟合良好,该比值(即对数似然比)将较小,麦克法登R²将接近1。如果仅含截距模型与数据拟合更紧密,该比值将更接近1,麦克法登R²将更接近0。
与麦克法登R²类似,考克斯-斯内尔R²使用所选模型的似然值以及拟合于同一数据的仅截距模型的似然值(麦克法登R²使用对数似然值)。在此情况下,
Cox-Snell 决定系数 = 1 – [(仅截距模型的似然值)/(指定模型的似然值)]²/n,其中 n 为观测值数量。
值得注意的是,尽管Cox-Snell R²与McFadden R²采用类似的方法,但Cox-Snell R²的上限并非1;事实上,在许多情况下,其上限可能远小于1。这意味着即使指定模型与数据完美契合,Cox-Snell R²也可能小于1!
纳格尔克尔克R²可视为一种“调整后的Cox-Snell R²”,旨在解决上述Cox-Snell R²上限并非1的问题。具体做法是将Cox-Snell R²除以其最大可能值。换言之:
Nagelkerke R² = (Cox-Snell R²)/(1 – 似然值(仅截距模型)²/n),其中 n 为观测值数量
本网站包含有关这些及其他伪R平方值的更多信息,而这篇论文则对这些指标及其他拟合优度指标进行了很好的评估。