在进行逻辑回归时,选择一个不包含截距项(β0)的模型是非常罕见的,罕见到Prism会显示一条警告,提醒您确保做出这一决定是有充分理由的。
若将截距项从模型中剔除,即意味着您假设当所有预测变量均为零时,观察到成功(P(Y=1))的概率等于 0.5。这种假设极少合理,因此截距项几乎总是保留在逻辑回归模型中。让我们审视逻辑回归模型,并探讨这一问题背后的数学原理:
Ln(几率) = β0 + β1*X1 + …
若将上式中的 Xi 设为零,则可简化为:
Ln(几率) = β0
因此,当所有其他预测因子均为零时,截距 β0 等于对数几率。从模型中剔除截距,在数学上等同于将截距项设为零。若将 e^(β0) 设为零并对上述方程取指数,可得:
eLn(几率) = eβ0
几率 = eβ0
几率 = e0
几率 = 1
现在,利用优势比可表示为“Y=1的概率”与“1 - Y=1的概率”之比这一事实。
几率 = 1
P(Y=1)/[1 - P(Y=1)] = 1
解得 P(Y=1):
P(Y=1) = (1)*[1 - P(Y=1)]
P(Y=1) = 1 - P(Y=1)
2*P(Y=1) = 1
P(Y=1) = 0.5
因此,通过从逻辑回归模型中排除截距项,您已假设当所有预测因子均为零时,观察到成功的概率为50%。这一假设很少适用,因此截距项几乎总是被包含在逻辑回归模型中。