Please enable JavaScript to view this site.

Navigation: 统计学原理 > 置信区间

解读平均数的置信区间

Scroll Prev Top Next More

置信区间并不量化变异性

95% 置信区间是一个数值范围,可以确信 95% 的概率包含总体真实均值。这与包含 95% 样本值的范围并不相同。下图突出了这一区别。

该图展示了三个(样本量各异)的样本,均来自同一总体。

对于左侧的小样本,其95%置信区间与数据范围相近。但右侧大样本中,只有极少数数据值位于置信区间内。这合乎逻辑。 95%置信区间定义了一个数值范围,可以95%的置信度断言该范围包含总体均值。对于大样本,我们对均值的估计精度远高于小样本,因此基于大样本计算出的置信区间会非常窄。

请勿将置信区间误解为包含95%数据值的范围。

95%的概率是指什么?

正确的说法是:您计算出的置信区间有95%的概率包含真实的总体均值。而说“总体均值有95%的概率位于该区间内”则并不完全准确。

两者有何区别?

总体均值只有一个值。您不知道它具体是多少(除非进行模拟),但它确实只有一个值。如果您重复实验,这个值不会改变(而您仍然不知道它具体是多少)。因此,询问总体均值落在某个范围内的概率并不完全准确。

相比之下,您计算出的置信区间依赖于您恰好收集到的数据。如果您重复实验,您的置信区间几乎肯定会不同。因此,询问该区间包含总体均值的概率是合理的。

询问总体均值落在该区间内的概率并不完全准确。总体均值要么在区间内,要么不在。这没有概率可言。 您可以这样说:如果您多次进行此类实验,所得的置信区间不会完全相同;预计其中95%会包含总体均值,5%的置信区间不包含总体均值;而对于某次特定实验的置信区间,您永远无法确定它是否包含总体均值。

95% 并无特殊之处

虽然置信区间通常以95%置信水平表示,但这仅仅是一种惯例。置信区间可以针对任何所需的置信水平进行计算。

人们常惊讶地发现,99%的置信区间比95%的区间更宽,而90%的区间则更窄。但这完全合乎逻辑。 如果您希望更确信某个置信区间包含真实参数,那么置信区间就会更宽。如果您希望100.000%确信某个置信区间包含真实总体参数,它就必须包含所有可能的值,因此会非常宽。如果您只愿意确信50%某个置信区间包含真实值,那么它就可以窄得多。