Please enable JavaScript to view this site.

Navigation: 回归原理 > 简单逻辑回归的原理 > 理解对数概率与系数估计值的解读

什么是对数概率,为什么逻辑回归要使用对数概率?

Scroll Prev Top Next More

简单逻辑回归模型的表达式为 logit[P(Y=1)] = β0 + β1 * X + 误差。

右边项与简单线性回归模型一致(请记住,简单线性回归模型为 Y = 截距 + 斜率*X)。左边项包含一个“logit”函数(长音o,软音g),用于调整 Y 作为仅能取值 0 或 1 的变量这一特性。 简而言之,logit 是 Y=1 的比值比的对数,而“P(Y=1)”是 Y 等于 1 的概率。请注意,此处的“P”是概率(probability)的缩写,与 P 值无关。

要理解“对数比值”的含义,必须先明确“比值”的定义。比值等于 Y=1 的概率除以 Y=0 的概率。 例如,若 Y=1 的概率为 0.8(即 Y=1 的概率为 80%),则 Y=0 的概率为 1-0.8 或 0.2(请记住,Y 只能是 0 或 1,因此 Y=0 的概率即为 1-[Y=1 的概率])。 利用这些数值,我们可以将赔率计算为这两个数值之比:

赔率 = P(Y=1)/P(Y=0) = 0.8/0.2 = 4

在此情况下,赔率为4。人们常将此称为4:1的赔率,读作“四比一的赔率”。既然我们已了解赔率与概率之间的关系,就可以进行最后一步,计算对数赔率。这只需使用计算出的赔率值,并对其取自然对数(Ln):

对数赔率 = Ln(赔率) = Ln(P(Y=1)/P(Y=0)) = Ln(P(Y=1)/[1-P(Y=1)])

上述所有对数比的形式都是等价的,虽然这些数学公式听起来可能相当令人困惑,但我们之所以要进行这些计算,是因为我们希望对 Y=1(或 Y=0)的概率进行建模。

更确切地说,我们希望使用线性模型(即简单逻辑回归方程的右边)来建模这一概率。请记住,概率的取值范围在0到1之间。而简单逻辑回归模型的右边,就像简单线性回归模型一样,在理论上可以产生从负无穷大到正无穷大的任何值。对数几率函数(logit函数)的作用就是作为这两个范围之间的桥梁。

首先考虑概率:这些值只能在0到1之间:

首先,我们取赔率,这将 0 到 1 的量表转换为 0 到正无穷的量表(计算 0 到 1 之间任意概率的赔率,您自己看看!):

接着,我们对比值取自然对数,得到对数比值,这将量表再次转换为从负无穷大到正无穷大的范围:

因此,您可以将对数 odds 函数理解为一种数学方法,用于将模型右侧生成的值(可以是任意数值)与概率的限定值(必须在 0 到 1 之间)建立联系。