GraphPad Prism 11 Curve Fitting Guide - 对方程重新参数化

Zoom Window Out
Larger Text | Smaller Text
Hide Page Header
Show Expanding Text
Printable Version
Save Permalink URL

Navigation: 使用 PRISM 进行回归分析 11 > 使用 Prism 进行非线性回归 > 在 Prism 中输入用户定义的模型 > 输入用户定义方程时使用的语法

对方程重新参数化

Scroll Prev Top Next More

重新设定方程的参数不会改变最佳拟合曲线

您希望将S型酶动力学数据拟合到标准模型中。但该模型通常有两种形式：

Y=Vmax*X^h/(Khalf^h + X^h)

Y=Vmax*X^h/(Kprime + X^h)

这两者是等价的，其中 Kprime 等于 Khalfh，因此两种拟合将生成完全相同的曲线，具有相同的平方和、相同的 R² 值以及相同的自由度。尽管这两个方程表达的是同一个模型，但它们的写法不同。专业术语称之为“参数化方式不同”。

两者均拟合 Vmax（外推至极高底物浓度时的最大活性）和 h（Hill斜率，描述曲线的陡峭程度）。但一个模型拟合 Khalf（达到最大速率一半所需的浓度），另一个则拟合 Kprime（对底物作用的一种更抽象的度量）。

哪种模型更优？

选择这两种模型的一种方法是参照其他教科书和论文，这样您的结果就能轻松地与他人进行比较。另一种方法是选择符合您思维方式的形式。以本示例为例，如果您更倾向于图形化思考，就选择 Khalf；如果您更倾向于机制化思考，就选择 Kprime。

但选择不仅关乎便利性和惯例。模型的选择会决定置信区间的准确性。请继续阅读以了解原因。

参数分布并非总是对称的

通过模拟可以判断参数的对称性。我模拟了S型酶动力学，参数设置为Vmax=100、h=5、Kprime=25，并采用标准差为7.5的高斯散布。X值与上图中的数据一致，每个X值点均对应三个Y值。Prism可以轻松完成此类模拟。利用 Prism 的蒙特卡洛分析，我重复了 5000 次模拟，将每条曲线分别拟合到两种模型形式中，并列出了 Kprime 和 Khalf 的控制数据，同时计算了各自的偏度。

Khalf的分布非常对称，呈现高斯分布特征。因此，其偏度接近于零。相比之下，Kprime的分布则明显偏斜。需注意，部分模拟数据集的Kprime控制数据大于100。偏度值（4.89）证实了肉眼观察到的明显现象 - 该分布远非对称。

对称渐近置信区间的覆盖

GraphPad Prism 的早期版本，与几乎所有非线性回归程序一样，计算最佳拟合参数的置信区间时，会使该区间以控制数据为中心呈对称分布。如果参数的不确定性确实是对称的，那么这些置信区间可以直接按字面意思进行解读。如果不确定性不对称，那么置信区间将不准确。

理想情况下，置信区间应易于解读。95%置信区间有95%的概率包含参数的真实值，5%的概率不包含。在分析真实数据时，我们永远无法得知真实参数的值，因此无法确定区间是否包含该值。但在模拟数据时，由于已知参数的真实值，便可量化置信区间的覆盖范围。我设置了上述相同的模拟实验，将每个数据集分别拟合到两个方程中，并统计了每个置信区间是否包含真实参数值。下表显示了在5,000次模拟中，置信区间未包含真实参数值的比例（Kprime为25次，Khalf为1.9037次）。

	“95% CI”	"99% CI"
理想情况	5.0%	1.0%
Kprime	8.8%	4.8%
Khalf	5.1%	1.0%

这些结果表明，Khalf 表现良好，这与其对称性相符（见上文）。95% 置信区间预计在 5.0% 的模拟中会漏掉真实值。实际上，这种情况发生了 5.1% 的次数。同样，99% 置信区间预计在 1.0% 的模拟中会漏掉真实值，而实际情况也完全如此。相比之下，Kprime 的表现较差。计算出的 95% 置信区间不够宽，因此在 8.8% 的模拟中未能包含实际值。99% 置信区间同样不够宽，导致在 4.8% 的模拟中未能包含实际值。因此，本应为 99% 置信区间的计算结果，实际上变成了 95% 置信区间。

这些模拟结果表明，选择拟合 Khalf 的方程比选择拟合 Kprime 的方程更具优势。Khalf 具有对称分布，因此根据这些拟合结果计算出的置信区间可以按字面意思解读。相比之下，Kprime 具有非对称分布，其置信区间不能按字面意思解读。

非对称似然置信区间的覆盖率

Prism 7 的一项新功能是能够计算非对称似然置信区间。无论方程如何参数化，这些区间的覆盖率均保持不变。在 10,000 次模拟中，Khalf 的 95% 置信区间仅有 5.3% 的概率未能包含真实值（25）。当方程被参数化以拟合 Kprime 时，95% 置信区间在 10,000 次模拟中有 5.1% 的概率未能包含真实值（1.9037）。

这证明了使用不对称置信区间的优势。无论如何对方程进行参数化，您都能获得有意义的置信区间。您可以选择那种参数化方式，使其参数既符合您对系统的理解，又便于解释。您无需刻意选择会导致参数呈对称分布的参数化方案。

霍加德偏度

上述结果是通过运行大量模拟获得的。其实还有一种更简单的方法来判断参数的对称性。Hougaard 偏度量化了每个参数的不对称性，其计算基于方程、数据点数量、X 值的间隔以及参数的数值。

对于该模拟数据集，Khalf 的 Hougaard 偏度为 0.09，而 Kprime 的 Hougaard 偏度为 1.83。经验法则是：当霍加德偏度绝对值大于 0.25 时，通常会出现因不对称性导致的问题；当该值大于 1.0 时，则会出现严重问题。因此，霍加德偏度表明，拟合 Khalf 时置信区间将较为准确，而拟合 Kprime 时则不够准确。

请注意，霍加德偏度可作为非线性回归结果的一部分进行报告（在“诊断”选项卡中选择）。无需进行模拟。

结论

模型通常可通过多种方式进行参数化。无论采用哪种方式，所得曲线都相同，但选择最优参数化方案可确保参数的置信区间具有可靠性。评估各种参数化方案的最佳方法是让 Prism 报告每个参数的 Hougaard 偏度值。模拟虽然需要多花些功夫，但能让您直观地看到参数的对称性。

本示例所用文件非对称置信区间文件。

Please enable JavaScript to view this site.