哪个模型是“最佳”的?乍看之下,答案似乎很简单。非线性回归的目标是使平方和最小化,因此看似平方和越小的模型就越好。如果两个备选模型的参数数量相同,那么这种方法确实是最佳的。
但当模型参数数量不同时(这种情况通常会发生),这种方法就过于简单了。 参数更多的模型可能拥有更多的拐点,因此自然能更贴近数据点。它可以通过更大的弯曲和扭转来接近数据点。相应地,两相模型几乎总是比单相模型拟合得更好,而三相模型的拟合效果则更佳。因此,任何用于比较简单模型与复杂模型的方法,都必须在平方和的减小与参数数量的增加之间取得平衡。
Prism 提供了三种用于比较参数数量不同的模型的方法。虽然解决此问题的已开发方法不止这些,但以下方法是最常用的。
额外平方和F检验基于传统的统计假设检验。它仅适用于最小二乘回归(不适用于Poisson回归)。
零假设认为简单模型(即参数较少的模型)是正确的。 复杂模型的改进程度通过平方和的差异来量化。仅凭偶然性就可能出现一定程度的改进,而这种偶然性带来的预期改进量由数据点数量和每个模型的参数数量决定。F 检验将平方和的实际差异与预期偶然差异进行比较。结果以 F 比值表示,并据此计算出 P 值。
P值回答了以下问题:
如果简单模型是正确的,在多少比例的实验(规模与您当前实验相当)中,平方和的差异会与您观察到的同样大,甚至更大?
如果 P 值较小,则可得出结论:简单模型(零假设)是错误的,并接受复杂模型。通常,P 值的阈值设定为传统的 0.05。如果 P 值小于 0.05,则拒绝简单模型,并得出结论:复杂模型拟合效果显著更好。
当您选择 Poisson 回归时,Prism 不会提供上述的 F 检验,而是提供似然比检验。
似然比回答了以下问题:相较于另一个模型成立的情况,若当前模型成立,观察到这些数据的可能性会高出多少。P值是根据似然比以及两个模型自由度的差值计算得出的。
P 值回答了以下问题:
如果简单模型是正确的,在多少比例的实验(规模与您的实验相当)中,似然比会达到您观察到的水平,甚至更大?
如果 P 值较小,则可推断简单模型(零假设)是错误的,并接受复杂模型。通常,P 值的阈值设定为传统的 0.05。如果 P 值小于 0.05,则拒绝简单模型,并得出结论:复杂模型拟合效果显著更好。
当选择最小二乘回归时,额外平方和F检验等同于似然比检验。
这种替代方法基于信息论,不采用传统的“假设检验”统计范式。因此,它不产生P值,不就“统计学显著性”得出结论,也不“拒绝”任何模型。
该方法综合考虑拟合优度(平方和)和模型参数数量,来判断数据对各模型的支持程度。结果以各模型正确的概率形式呈现,所有概率之和为100%。 如果某个模型比另一个模型正确的可能性高得多(例如 1% 对比 99%),您就会选择它。如果可能性的差异不大(例如 40% 对比 60%),您就会知道两个模型都可能是正确的,因此需要收集更多数据。计算原理。
在大多数情况下,您要比较的模型是“嵌套”的。这意味着一个模型是另一个模型的简化形式。例如,单相指数模型是双相指数模型的简化形式。一个标准Hill斜率为1.0的三参数剂量反应曲线,是四参数剂量反应曲线的特例,后者还会求解Hill斜率的控制数据。
如果两个模型是嵌套的,您可以使用 F 检验(如果是 Poisson回归,则使用似然比检验)或 AIC 方法。选择通常取决于个人偏好和传统。药理学和生理学的基础科学家倾向于使用 F 检验。生态学和种群生物学等领域的科学家则倾向于使用 AIC 方法。
如果模型不具有嵌套关系,则 F 检验和似然比检验均不适用,因此应选择信息论方法。请注意,Prism 不会检验模型是否具有嵌套关系。
Prism 的“比较”选项卡允许您提出以下问题:“所选非共享参数的控制数据在不同数据集之间是否存在差异?”或“是否有一条曲线能充分拟合所有数据集?”。应用 F 检验或赤池方法来回答这些问题非常直观。Prism 会比较两个拟合结果的平方和。
•在一种拟合中,模型分别拟合到每个数据集,并用平方和来量化拟合优度。这些平方和值的总和则量化了拟合所有数据集的曲线族所具有的拟合优度。
•另一种拟合则是对所有数据集进行一次全局拟合,共享指定的参数。如果您询问 Prism 是否有一条曲线能充分拟合所有数据集,那么它将共享所有参数。
这两种拟合是嵌套关系(第二种是第一种的简化情况,需拟合的参数较少),因此可以通过平方和F检验或赤池法(Akaike's method)来比较这些平方和(实际上是第一种拟合所得平方和的总和)。
R²是衡量模型拟合数据优劣的指标,因此选择竞争模型时,似乎理应挑选R²或调整后R²值最低的那一个。事实上,这种做法效果极差(1)。请勿使用此方法!
1. Spiess, A.-N. & Neumeyer, N. 《R²作为药理学和生物化学研究中非线性模型不恰当指标的评估:一种蒙特卡洛方法》。BMC Pharmacol 10, 6–6 (2010)。