
您希望将S型酶动力学数据拟合到标准模型中。但该模型通常有两种形式:
Y=Vmax*X^h/(Khalf^h + X^h)
Y=Vmax*X^h/(Kprime + X^h)
这两者是等价的,其中 Kprime 等于 Khalfh,因此两种拟合将生成完全相同的曲线,具有相同的平方和、相同的 R² 值以及相同的自由度。尽管这两个方程表达的是同一个模型,但它们的写法不同。专业术语称之为“参数化方式不同”。
两者均拟合 Vmax(外推至极高底物浓度时的最大活性)和 h(Hill斜率,描述曲线的陡峭程度)。但一个模型拟合 Khalf(达到最大速率一半所需的浓度),另一个则拟合 Kprime(对底物作用的一种更抽象的度量)。
选择这两种模型的一种方法是参照其他教科书和论文,这样您的结果就能轻松地与他人进行比较。另一种方法是选择符合您思维方式的形式。以本示例为例,如果您更倾向于图形化思考,就选择 Khalf;如果您更倾向于机制化思考,就选择 Kprime。
但选择不仅关乎便利性和惯例。模型的选择会决定置信区间的准确性。请继续阅读以了解原因。
通过模拟可以判断参数的对称性。我模拟了S型酶动力学,参数设置为Vmax=100、h=5、Kprime=25,并采用标准差为7.5的高斯散布。X值与上图中的数据一致,每个X值点均对应三个Y值。Prism可以轻松完成此类模拟。 利用 Prism 的蒙特卡洛分析,我重复了 5000 次模拟,将每条曲线分别拟合到两种模型形式中,并列出了 Kprime 和 Khalf 的控制数据,同时计算了各自的偏度。

Khalf的分布非常对称,呈现高斯分布特征。因此,其偏度接近于零。相比之下,Kprime的分布则明显偏斜。需注意,部分模拟数据集的Kprime控制数据大于100。偏度值(4.89)证实了肉眼观察到的明显现象 - 该分布远非对称。
GraphPad Prism 的早期版本,与几乎所有非线性回归程序一样,计算最佳拟合参数的置信区间时,会使该区间以控制数据为中心呈对称分布。如果参数的不确定性确实是对称的,那么这些置信区间可以直接按字面意思进行解读。如果不确定性不对称,那么置信区间将不准确。
理想情况下,置信区间应易于解读。95%置信区间有95%的概率包含参数的真实值,5%的概率不包含。在分析真实数据时,我们永远无法得知真实参数的值,因此无法确定区间是否包含该值。但在模拟数据时,由于已知参数的真实值,便可量化置信区间的覆盖范围。 我设置了上述相同的模拟实验,将每个数据集分别拟合到两个方程中,并统计了每个置信区间是否包含真实参数值。下表显示了在5,000次模拟中,置信区间未包含真实参数值的比例(Kprime为25次,Khalf为1.9037次)。
“95% CI” |
"99% CI" |
|
理想情况 |
5.0% |
1.0% |
Kprime |
8.8% |
4.8% |
Khalf |
5.1% |
1.0% |
这些结果表明,Khalf 表现良好,这与其对称性相符(见上文)。95% 置信区间预计在 5.0% 的模拟中会漏掉真实值。实际上,这种情况发生了 5.1% 的次数。同样,99% 置信区间预计在 1.0% 的模拟中会漏掉真实值,而实际情况也完全如此。 相比之下,Kprime 的表现较差。计算出的 95% 置信区间不够宽,因此在 8.8% 的模拟中未能包含实际值。99% 置信区间同样不够宽,导致在 4.8% 的模拟中未能包含实际值。因此,本应为 99% 置信区间的计算结果,实际上变成了 95% 置信区间。
这些模拟结果表明,选择拟合 Khalf 的方程比选择拟合 Kprime 的方程更具优势。Khalf 具有对称分布,因此根据这些拟合结果计算出的置信区间可以按字面意思解读。相比之下,Kprime 具有非对称分布,其置信区间不能按字面意思解读。
Prism 7 的一项新功能是能够计算非对称似然置信区间。无论方程如何参数化,这些区间的覆盖率均保持不变。 在 10,000 次模拟中,Khalf 的 95% 置信区间仅有 5.3% 的概率未能包含真实值(25)。当方程被参数化以拟合 Kprime 时,95% 置信区间在 10,000 次模拟中有 5.1% 的概率未能包含真实值(1.9037)。
这证明了使用不对称置信区间的优势。无论如何对方程进行参数化,您都能获得有意义的置信区间。您可以选择那种参数化方式,使其参数既符合您对系统的理解,又便于解释。您无需刻意选择会导致参数呈对称分布的参数化方案。
上述结果是通过运行大量模拟获得的。其实还有一种更简单的方法来判断参数的对称性。Hougaard 偏度量化了每个参数的不对称性,其计算基于方程、数据点数量、X 值的间隔以及参数的数值。
对于该模拟数据集,Khalf 的 Hougaard 偏度为 0.09,而 Kprime 的 Hougaard 偏度为 1.83。 经验法则是:当霍加德偏度绝对值大于 0.25 时,通常会出现因不对称性导致的问题;当该值大于 1.0 时,则会出现严重问题。因此,霍加德偏度表明,拟合 Khalf 时置信区间将较为准确,而拟合 Kprime 时则不够准确。
请注意,霍加德偏度可作为非线性回归结果的一部分进行报告(在“诊断”选项卡中选择)。无需进行模拟。
模型通常可通过多种方式进行参数化。无论采用哪种方式,所得曲线都相同,但选择最优参数化方案可确保参数的置信区间具有可靠性。评估各种参数化方案的最佳方法是让 Prism 报告每个参数的 Hougaard 偏度值。模拟虽然需要多花些功夫,但能让您直观地看到参数的对称性。