GraphPad Prism 11 Curve Fitting Guide - 置信带和预测带如何计算

置信带和预测带如何计算

置信带与预测带的区别

请注意置信带与预测区间的区别：

•95% 置信带包围的区域，是您有 95% 的把握包含真实曲线的区域。如果数据点很多，置信带将紧邻直线或曲线，而大部分数据将位于置信带之外。

•95%预测带包围的区域，是预期能容纳95%未来数据点的区域。它们比置信带更宽 - 在数据集较大时，会宽得多。

此外，需区分参数的 95% 置信区间（一组数值范围）与围绕曲线的 95% 置信带。

置信带和预测带的计算方法相当标准，且只能通过矩阵来表示。以下是简要说明。更多细节可参见此处。

首先，定义 G|x，即在特定 X 值下，使用所有控制数据计算出的参数梯度。结果是一个向量，每个参数对应一个元素。对于每个参数，其定义为 dY/dP，其中 Y 是给定特定 X 值和所有控制数据时曲线的 Y 值，P 是其中一个参数。

G'|x 是该梯度向量的转置，因此它是一列值而非一行值。

Cov 是协方差矩阵（上一次迭代的逆海森矩阵）。它是一个方阵，其行数和列数等于参数的数量。矩阵中的每一项都是两个参数之间的协方差。请注意，这是实际的协方差矩阵，与 Prism 可能报告的归一化协方差矩阵（其中每个值在 -1 到 1 之间）不同。

现在计算 c = G|x * Cov * G'|x。结果对于 X 的任何取值都是一个单一数值。

置信带和预测带以最佳拟合曲线为中心，并向曲线上下延伸等距。

置信带在曲线上下延伸的距离为：

= sqrt(c)*sqrt(SS/DF)*CriticalT(置信度%, DF)

预测带在曲线上下延伸的距离更大，等于：

= √(c+1) * √(SS/DF) * CriticalT(置信度%, DF)

在这两个公式中，c 的值（如上所述）依赖于 X 的值，因此置信带和预测带与曲线的距离并非恒定。SS 的值是拟合的平方和，DF 是自由度（数据点数减去参数数）。临界T值是基于所需置信水平和自由度计算出的t分布常数。对于95%置信区间且自由度较大时，该值接近1.96。若自由度较小，该值则较高。