Please enable JavaScript to view this site.

下图中的四幅图表由安斯康姆(1)绘制,旨在说明仔细观察数据的重要性。这四组数据(即“安斯康姆四重奏”)均包含11个数据点。一眼就能看出,这些数据之间存在显著差异。令人惊讶的是,对这四组数据的分析结果在许多方面却完全一致。当采用线性回归进行分析时,这四幅图表的所有数值均完全相同:

X 和 Y 的均值

斜率和截距

斜率和截距的标准误差及置信区间

残差的标准差(sy.x)

在检验“斜率确实为 0.0(水平)”这一原假设时的 F 比值和 P 值。

斜率与截距之间的协方差(由Prism的非线性回归分析计算得出)

线性回归中观察到的差异包括:

下图中以黄色显示的置信带,在四幅图中的三幅是相同的,但在第四幅图中则不同(因其X值不同)

线性性Runs检验的结果

残差的正态性检验

 

1. F.J. Anscombe, 《统计分析中的图表》,《美国统计学家》,27卷(1973年2月),第17-21页。