Please enable JavaScript to view this site.

当因变量(Y)为二分类变量(是/否、成功/失败等)时,应使用多元逻辑回归。因变量(Y)必须只有两个取值。它可以是取值为“0”和“1”的连续变量,也可以是具有两个(文本)水平的分类变量。 多元逻辑回归将根据一个或多个自变量(X)的特定取值,估计Y等于1的概率(或Y等于指定分类水平的概率)。

选择因变量

从下拉菜单中选择包含因变量(Y)的相应列。请注意,该变量只能包含两个值(必须是取值为“1”和“0”的连续变量,或具有两个水平的分类变量)。如果使用连续变量(取值为“0”和“1”)作为因变量,则可在“参数”对话框的“选项”标签页中添加标签以标识这些值。

定义模型

除对 Y 值的限制外,数据输入方式与多元线性回归相同。Prism 使选择纳入模型的变量变得简单,包括二元和三元交互作用以及变量转换。但是,Prism 无法自动为您选择一组变量或交互作用。阅读原因

截距

对于逻辑回归,截距是指当所有 X 值均为零时的预期对数比值。若您对此难以直观理解,您并非孤例。由于逻辑回归中对因变量进行了对数比值转换,该值的解释性远低于线性回归。 或许最简单的理解方式是结合逻辑回归绘制的 S 形曲线来思考。截距项可以提供当 X 为零时该 S 形曲线的值。通过一些简单的代数运算,可以证明该 S 形曲线在 X=0 时的值由以下公式给出:

当X为0时的概率 = e^(β0) / (1 + e^(β0))

另一种理解方式是:截距项使您能够确定在没有(或已考虑)预测变量的情况下,成功的概率。

关于逻辑回归模型的截距,有一点非常重要:几乎没有任何理由将其排除。如上所述,逻辑回归模型的截距(β0)值告诉您,当所有预测变量(X变量)都等于零时,预测的对数几率是多少。 若将这一信息从对数几率尺度转换为概率尺度,模型的截距便提供了在控制所有其他变量后观察到“成功”(Y=1)的概率信息。然而,若将截距从模型中剔除,则意味着您假设当所有X变量均为零时,观察到“成功”的概率等于0.5(或50%)。 若感兴趣,您可在此处进一步了解相关的数学原理。但关键在于,在没有预测因子的情况下,“成功”的概率为0.5这一假设(或您希望作出的这一假设)实属罕见。因此,您几乎总是希望在模型中包含截距项。

主效应

使用复选框选择要纳入模型的X变量。拟合模型时,Prism将为每个选定的主效应(以及选定的每个交互作用和变换项)确定一个回归系数。默认情况下,所有主效应均被选中。若取消选中某个主效应,该X变量实质上将不参与分析(除非该变量属于下文所述的交互作用或变换项)。

交互作用

Prism 使将独立变量的二元和三元交互作用纳入模型变得非常简单。二元交互作用是将两个变量相乘,从而生成一个新变量,模型将为此确定一个回归系数。同样,三元交互作用是将三个变量相乘。三元交互作用的使用频率低于二元交互作用。

变换

Prism 允许您在模型中使用任何变量的平方、立方或平方根。如果您希望 Prism 在定义多元回归模型时提供其他变换选项,请告知我们。