Please enable JavaScript to view this site.

“异常值”的定义

“异常值”一词的定义相当模糊,但通常指与其他值相差甚远的数值。在 Prism 的非线性回归中,异常值是指远离由稳健回归定义的最佳拟合曲线的点。

当然,存在一种可能性,即某个异常值实际上与其他数据点来自同一高斯总体,只是恰好数值极高或极低。您可以通过设置 Q 值来控制 Prism 判定异常值的严格程度。

异常值并非总是源于错误

非线性回归通常用于处理实验数据,其中 X 代表时间、浓度或其他实验中可控的变量。由于所有数据离散均源于实验误差,因此剔除极端异常值是合理的,因为它们几乎可以肯定是由实验失误造成的。

但在其他情况下,每个数据点可能代表不同的个体。 在这种情况下,异常值可能并非源于实验失误,而是生物变异或模型中未包含的其他变量差异所致。此时,异常值的存在可能正是研究中最值得关注的发现。虽然 ROUT 异常值方法在此情境下或许有助于标记异常值,但若未经深思(或实验验证)便自动排除此类异常值,将是一个重大错误。

在质量控制分析中,异常值可能揭示了过程失控的情况。在弄清该值为何与其他值相差甚远之前,不应随意删除异常值。该异常值或许正在向您传递重要信息。