Please enable JavaScript to view this site.

Navigation: 回归原理 > 非线性回归原理 > 非线性回归入门

不要对平滑数据拟合模型

Scroll Prev Top Next More

该图展示了飓风数量随时间的变化情况。左侧图表显示了每年的飓风数量,其数值波动很大。为了便于发现趋势,右侧图表展示了滑动平均值。图中每年的数值是该年飓风数量与前八年飓风数量的平均值。这种平滑处理使趋势变得清晰可见。

但这里存在一个问题。这些并非真实数据。实际上,左侧面板中绘制的数值是随机选取的(来自均值为10的泊松分布)。其中没有任何规律可循。每个数值都是独立生成的,与前一个(或后一个)数值无关。

滚动平均法的构建通过放大任何向高值或低值的剧烈随机波动,同时抑制年际波动,从而营造出趋势存在的假象。

不应使用线性或非线性回归对移动平均数据拟合模型,也不应计算相关系数。任何此类结果均无效且具有误导性。问题在于,回归分析假设每个数值彼此独立,但移动平均值之间绝非独立。相反,每个数值都包含在相邻数值之中。

本例改编自Briggs (2008)