Prism 提供了多种可报告的选项,这些选项能反映指定模型与基于同一数据拟合的其他模型相比的表现如何。具体而言,Prism 将分别针对指定模型和仅截距模型,报告 Akaike 修正信息准则 (AICc)、负对数似然值以及模型偏差的数值。以下将简要说明这些数值。
该值源自信息论方法,旨在评估数据与模型的拟合程度。它既依赖于模型偏差(详见下文),也依赖于模型中的参数数量。 请注意,许多其他软件包仅报告AIC值。这是赤池信息准则的未修正形式,研究表明当样本量较小时,该方法会选择参数过多的模型(即会导致过拟合)。以下是计算AIC和AICc所需的公式,以及两者之间的转换方法。
AIC = 2*k + 偏差
其中 k 为模型中的参数个数(Prism 在结果的“数据摘要”部分中报告)
AICc = AIC + [(2k² + 2k)/(n – k – 1)]
其中 n 为样本量/观测值数量(Prism 在结果的“数据摘要”部分中报告)
请注意,线性和非线性回归中 AIC 和 AICc 的计算公式略有不同。线性和非线性回归(及多元线性回归)本质上是拟合平方和的值,因此上述公式中的 k 应替换为 k+1。
尽管似然的概念有些复杂,但这仅仅是另一个衡量指标,可用于评估指定模型与输入数据的拟合程度。从数学上讲,对数似然为:
对数似然 = Σ(ln(输入值为 1 时的预测概率)) + Σ(ln(1 - 输入值为 0 时的预测概率))
由于预测概率均小于 1(且 1 – 预测概率也小于 1),这些值的自然对数均为负数。因此,所有这些负数的和也是负数。所以,我们需要取该值的负数,才能得到“负对数似然”的正值(我知道这听起来有些令人困惑)。
一般而言,在比较两个拟合于同一数据集的模型时,对数似然值越大(即负对数似然值越小)的模型被认为“拟合”得更好。
Prism报告的这一最终指标可用于评估模型与数据的拟合程度,同样基于模型的似然值。如上所述,偏差量在计算逻辑回归的AIC(及AICc)时也会被直接使用。幸运的是,一旦计算出负对数似然值,计算模型偏差量便十分简单:
模型偏差 = 2*(负对数似然)
有时您会看到它被表示为
偏差 = -2*ln(似然值),甚至写成
偏差 = -ln(似然值²)
这也是为什么偏差有时也被称为“G的平方”