高斯分布在统计学中扮演着核心角色,这源于一个被称为“中心极限定理”的数学关系。要理解这个定理,请进行以下一个假想实验:
1.建立一个具有已知分布(不一定是高斯分布)的总体。
2.从该总体中随机抽取许多等大小的样本。将这些样本的均值整理成表。
3.绘制这些样本均值的频率分布直方图。
中心极限定理指出:只要样本量足够大,即使总体分布并非高斯分布,样本均值的分布仍将服从高斯分布。由于大多数统计检验(如t检验和方差分析)仅关注均值之间的差异,中心极限定理使得这些检验即使在总体非高斯分布的情况下也能有效运作。但要使该定理成立,样本量必须足够大。 具体需要多大样本量?这取决于总体分布与高斯分布的偏离程度。假设总体分布并非极其异常,通常样本量达到10左右就足以适用中心极限定理。
若想进一步了解理想的高斯分布为何如此有用,请查阅任何统计学教材中关于中心极限定理的内容。