Please enable JavaScript to view this site.

关于假设检验原理的简要回顾

Prism 提供了两种假设检验方法,用于评估模型与输入数据的拟合程度。与您可能接触过的其他基于假设的检验一样,这两种检验首先需要定义一个零假设(H0)。随后,每种检验都会计算一个检验统计量及其对应的 P 值。 计算出的 P 值代表在零假设成立的情况下,获得一个与计算结果大小相当(或更大)的检验统计量的概率。该检验还要求设定一个阈值,即 P 值必须小于该阈值,才能决定是否拒绝零假设。这个 - 诚然是任意的 - 阈值通常设定为 0.05,也被称为 α 水平。 若所得P值小于α,则拒绝零假设。

在阅读下文关于各项检验的说明之前,理解“指定模型”和“仅截距模型”这两个术语的含义也很重要。指定模型即简单地指拟合到数据上的模型(即您在分析的“模型”选项卡中定义的模型)。它包含了预测变量对观察到成功概率的影响。 仅截距模型则假设预测变量的贡献为零。换言之,该模型假设所有独立变量均无法帮助预测结果。

霍斯默-莱梅肖(HL)检验

Hosmer-Lemeshow 检验是逻辑回归的一种经典假设检验。零假设认为指定模型是正确的(即拟合良好)。该检验的工作原理是:首先按预测概率对观测值进行排序,并将它们分成 10 个观测值数量相等的组(N)。 对于每个组,计算其预测概率的平均值,并将该平均值乘以 N 以得到该组的预期 1 的数量(进而得到该组的预期 0 的数量)。随后,利用各组的实际观察值与期望值的 0 和 1 数量,计算皮尔逊拟合优度统计量,并将其在所有组中求和。最后采用卡方检验计算 P 值。

如前所述,零假设是指定模型拟合良好,因此与许多检验不同,较小的 P 值表明模型与数据的拟合度较差。 另一种理解方式是:较小的P值表明,在给定10个区间的情况下,0和1的实际计数与期望值的偏差,超出了随机波动的范围。因此,模型中可能遗漏了某些额外因素、交互作用或变换。

该检验因分箱数(10)设定任意而受到批评,因为已有研究表明,改变该数值会影响检验结果。尽管不建议使用该检验,但 Prism 仍将其作为选项包含在内,以便您将 Prism 中获得的结果与其他地方计算的结果进行比较。

对数似然比检验(LRT)

对数似然比检验同样是一种经典检验,用于比较所选模型与仅含截距模型的拟合优度。在此情况下,零假设是仅截距模型拟合最佳,因此较小的 P 值表明您将拒绝该零假设(或表明指定模型优于仅截距模型)。 顾名思义,该检验利用指定模型和仅截距模型的对数似然值来计算相应的统计量和 P 值。虽然该检验专门针对定义的模型与仅截距模型进行比较,但它与“多元逻辑回归参数”对话框中“比较”选项卡提供的检验相同,可用于比较任意两个嵌套模型。

似然比反映了数据由拟合模型解释的可能性比仅截距模型解释的可能性高出多少。如果独立变量能很好地预测结果,似然比将较高,相应的 P 值将较小。

请注意 P 值的不同含义

在两种检验中,较小的 P 值具有相反的含义:

霍斯默-莱梅肖检验中较小的 P 值意味着指定模型无法很好地预测数据。请考虑是否需要在模型中加入更多的独立变量或交互作用。

似然比检验中较小的 P 值则意味着仅含截距项的模型无法很好地预测数据。所指定的自变量和交互作用改善了模型对数据的拟合度。