95% 置信区间是一个数值范围,可以确信 95% 的概率包含总体真实均值。这与包含 95% 样本值的范围并不相同。下图突出了这一区别。

该图展示了三个(样本量各异)的样本,均来自同一总体。
对于左侧的小样本,其95%置信区间与数据范围相近。但右侧大样本中,只有极少数数据值位于置信区间内。这合乎逻辑。 95%置信区间定义了一个数值范围,可以95%的置信度断言该范围包含总体均值。对于大样本,我们对均值的估计精度远高于小样本,因此基于大样本计算出的置信区间会非常窄。
|
请勿将置信区间误解为包含95%数据值的范围。 |
正确的说法是:您计算出的置信区间有95%的概率包含真实的总体均值。而说“总体均值有95%的概率位于该区间内”则并不完全准确。
两者有何区别?
总体均值只有一个值。您不知道它具体是多少(除非进行模拟),但它确实只有一个值。如果您重复实验,这个值不会改变(而您仍然不知道它具体是多少)。因此,询问总体均值落在某个范围内的概率并不完全准确。
相比之下,您计算出的置信区间依赖于您恰好收集到的数据。如果您重复实验,您的置信区间几乎肯定会不同。因此,询问该区间包含总体均值的概率是合理的。
询问总体均值落在该区间内的概率并不完全准确。总体均值要么在区间内,要么不在。这没有概率可言。 您可以这样说:如果您多次进行此类实验,所得的置信区间不会完全相同;预计其中95%会包含总体均值,5%的置信区间不包含总体均值;而对于某次特定实验的置信区间,您永远无法确定它是否包含总体均值。
虽然置信区间通常以95%置信水平表示,但这仅仅是一种惯例。置信区间可以针对任何所需的置信水平进行计算。
人们常惊讶地发现,99%的置信区间比95%的区间更宽,而90%的区间则更窄。但这完全合乎逻辑。 如果您希望更确信某个置信区间包含真实参数,那么置信区间就会更宽。如果您希望100.000%确信某个置信区间包含真实总体参数,它就必须包含所有可能的值,因此会非常宽。如果您只愿意确信50%某个置信区间包含真实值,那么它就可以窄得多。