Please enable JavaScript to view this site.

置信带与预测带的区别

请注意置信带与预测区间的区别:

95% 置信带包围的区域,是您有 95% 的把握包含真实曲线的区域。如果数据点很多,置信带将紧邻直线或曲线,而大部分数据将位于置信带之外。

95%预测带包围的区域,是预期能容纳95%未来数据点的区域。它们比置信带更宽 - 在数据集较大时,会宽得多。

此外,需区分参数的 95% 置信区间(一组数值范围)与围绕曲线的 95% 置信带。

置信带与预测带的计算方法

置信带和预测带的计算方法相当标准,且只能通过矩阵来表示。以下是简要说明。更多细节可参见此处

首先,定义 G|x,即在特定 X 值下,使用所有控制数据计算出的参数梯度。结果是一个向量,每个参数对应一个元素。对于每个参数,其定义为 dY/dP,其中 Y 是给定特定 X 值和所有控制数据时曲线的 Y 值,P 是其中一个参数。

G'|x 是该梯度向量的转置,因此它是一列值而非一行值。

Cov 是协方差矩阵(上一次迭代的逆海森矩阵)。它是一个方阵,其行数和列数等于参数的数量。矩阵中的每一项都是两个参数之间的协方差。请注意,这是实际的协方差矩阵,与 Prism 可能报告的归一化协方差矩阵(其中每个值在 -1 到 1 之间)不同。

现在计算 c = G|x * Cov * G'|x。结果对于 X 的任何取值都是一个单一数值。

置信带和预测带以最佳拟合曲线为中心,并向曲线上下延伸等距。

置信带在曲线上下延伸的距离为:

= sqrt(c)*sqrt(SS/DF)*CriticalT(置信度%, DF)

预测带在曲线上下延伸的距离更大,等于:

= √(c+1) * √(SS/DF) * CriticalT(置信度%, DF)

在这两个公式中,c 的值(如上所述)依赖于 X 的值,因此置信带和预测带与曲线的距离并非恒定。SS 的值是拟合的平方和,DF 是自由度(数据点数减去参数数)。 临界T值是基于所需置信水平和自由度计算出的t分布常数。对于95%置信区间且自由度较大时,该值接近1.96。若自由度较小,该值则较高。