“所有模型都是错误的,但有些是有用的”
-乔治·E·P·博克斯
上文引述强调了一个事实:统计模型极少(甚至从未)能完全捕捉到系统或总体真正的复杂性。相反,模型的作用是将现实简化为一种更易于解读和理解的形式。 其结果是,针对同一个系统或总体,可能会有多种不同的模型被提出作为其简化版本。正因如此,我们通常视为对单一模型结果的“解释”的许多内容,实际上是不同竞争模型之间经过巧妙伪装的比较。 例如,一种常见的比较是将分析中指定的模型与所谓的“空”模型或“零”模型进行对比。这种零模型仅仅是一个不包含任何预测变量的模型,当与分析中指定的模型进行比较时,可用于确定指定模型中包含的预测变量的相对重要性,或评估指定模型的整体“拟合度”。 例如,结果中模型诊断部分的数值(AIC、偏对数似然值、偏对数似然值的负两倍以及伪R平方)通常用于将指定模型与零模型进行比较。
相比之下,分析参数对话框中“比较”选项卡上的控件旨在比较用户指定的两个模型(两个竞争模型)。这些控件的工作原理与其他类型的多重回归(包括多元线性回归和逻辑回归)类似。该选项卡上的可用选项允许您指定第二个模型(具有不同的预测变量、交互作用项和/或变换组合),并比较每个模型对输入数据的拟合程度。 如上所述,这些控件不应用于指定“零模型”进行比较,而仅应用于比较两个包含预测变量的模型。有关与零模型比较的更多信息,请参阅下文“与零模型的比较”一节。
Prism 提供了两种不同的方法来评估“模型”选项卡中指定的模型与“比较”选项卡中指定的模型之间的比较。这些方法分别是赤池信息准则 (AIC) 和似然比检验。
AIC 是一种基于信息论的方法,用于确定数据对每个模型的支持程度,同时考虑了每个模型的偏对数似然值以及模型中包含的参数数量。在 Cox比例风险回归对话框的“选项”选项卡中,还提供了报告所选模型的偏对数似然值(以及偏似然值的负两倍)的选项。 结果以各模型正确的概率形式呈现,各概率之和为 100%。显然,该方法未考虑其他模型正确的可能性,仅比较被要求比较的两个模型。如果一个模型比另一个更可能正确(例如 1% 对比 99%),则应选择前者。 然而,如果差异不大(例如 40% 与 60%),您无法确定哪个模型更好,此时应收集更多数据。重要的是,AIC 可用于比较同一数据集上的任意两个模型。计算 AIC 的公式相对简单:
AIC = -2*(对数似然值) + 2*k,
其中 k 表示模型参数的数量。
本检验报告了所选模型计算出的AIC值之间的差异。关于Cox比例风险回归中AIC的计算方法,可参阅此处。请注意,由于在存在删剪数据的情况下难以确定观测值数量,Prism(与其他应用程序一样)仅报告AIC,而不报告校正后的AIC(AICc)。
与AIC类似,LRT同样使用偏对数似然来确定优选模型。但与AIC不同,LRT仅适用于其中一个模型是另一个模型的简化版本的情况。 另一种描述这种情况的方式是说这两个模型是“嵌套”的。尽管该检验仅在模型嵌套时才有效,但 Prism 不会检查模型是否嵌套。因此,在选择使用此检验比较两个模型时,必须格外谨慎。
检验统计量计算为简单模型(参数较少的模型)与复杂模型(参数较多的模型)的偏对数似然值之差的标准化值:
LRT 统计量 = -2*[(简单模型的)偏对数似然值 - (较复杂模型的)偏对数似然值]
向模型添加参数(几乎)总是会增加该模型的偏对数似然值。因此,该检验统计量考察的是,与复杂模型相比,数据由简单模型生成的“可能性”高出多少。该统计量的数值用于计算 P 值。较小的 P 值表明应拒绝“简单模型是正确的”这一零假设。 在 Prism 中,您可以指定拒绝零假设所需的 P 值阈值(默认值为 0.05)。
最后,在Cox比例风险回归对话框的“比较”选项卡中,必须定义第二个模型的主效应、交互作用和变换。在许多情况下,第二个模型将嵌套在第一个模型中(即它将使用第一个模型中效应、交互作用和变换的子集)。如果是这种情况,第二个模型将是一个“简单模型”。 请注意,Cox比例风险回归模型不包含截距项,因此截距项不会作为选项出现。
在进行Cox比例风险回归时,将指定模型与“零模型”(即完全不包含任何预测变量模型)进行比较通常非常有用。不过,您无需使用“比较”选项卡上的选项来设置此比较。实际上,对于“模型”选项卡上指定的任何模型,Prism都会自动将与零模型的比较结果作为标准输出的一部分呈现。 默认情况下,指定模型和零模型的AIC值会在“表格结果”的模型诊断部分中报告;而用于报告指定模型和零模型的偏对数似然值或负两倍偏对数似然值(用于计算似然比检验统计量)的选项,则可在分析对话框的“选项”选项卡中找到。