Please enable JavaScript to view this site.

Navigation: 统计学原理 > 置信区间

比较置信区间、预测区间和容许区间

Scroll Prev Top Next More

当您将参数拟合到模型时,其准确度或精确度可以表示为置信区间、预测区间或容许区间。这三者有显著区别。Prism 仅报告置信区间。

下文将以对数据样本拟合均值(假设采样来自高斯分布)这一简单情况为例,解释这三种不同的区间。同样的原理也可应用于由回归确定的任何最佳拟合参数的区间。

置信区间

置信区间反映了您对均值的估计精度。假设数据确实是从高斯分布中随机抽取的。如果您重复进行多次抽样,并针对每次样本计算均值的置信区间,预计约 95% 的置信区间将包含总体均值的真实值。关键在于,置信区间揭示了真实总体参数可能的位置。

预测区间

预测区间能告诉您,下一个抽样数据点预计会出现在哪里。假设数据确实是从高斯分布中随机抽取的。收集一组数据并计算出预测区间,然后从总体中再抽取一个值。 如果您重复这个过程多次,预计在95%的样本中,该新值将落在该预测区间内。关键点在于,预测区间反映的是值的分布情况,而非确定总体均值时的不确定性。

预测区间必须同时考虑已知总体均值的不确定性以及数据的离散程度。因此,预测区间总是比置信区间更宽。

在探讨容许区间之前,让我们先定义一下定义预测区间时使用的“预期”一词。这意味着有50%的概率,在超过95%的样本中您会看到该值落在区间内;同时也有50%的概率,在少于95%的样本中您会看到该值落在区间内。

容许区间

如果您希望有95%的把握,确保该区间包含95%的观测值呢?或者希望有90%的把握,确保该区间包含99%的观测值呢?这些后者的问题由容许区间来解答。要计算或理解容许区间,您必须指定两个不同的百分比。一个表示您希望达到的置信程度,另一个表示该区间将包含多少比例的观测值。 若将第一个值(置信度)设为50%,则容许区间即等同于预测区间。若将其设为更高值(例如90%或99%),则容许区间会更宽。