Please enable JavaScript to view this site.

Navigation: 统计学原理 > 非参数检验

建议:不要自动做出使用非参数检验的决定

Scroll Prev Top Next More

请勿采用此方法:

首先进行正态性检验。如果 P 值较低,表明数据不服从高斯分布,则选择非参数检验。否则选择常规检验。

Prism 不会采用这种方法,因为参数检验与非参数检验的选择远比这复杂得多。

通常,分析是系列实验中的一项。由于您希望以相同的方式分析所有实验,因此不能仅依赖单次正态性检验的结果。

许多生物变量服从对数正态分布。如果您的数据采样自对数正态分布,分析数据的最佳方法是先进行对数转换,然后对对数值进行分析。如果不考虑转换就直接跳到非参数检验,那将是一个错误。

根据数据分布的不同,其他变换(如倒数变换)也可能有所帮助。

数据可能因存在异常值而未能通过正态性检验。移除该异常值可恢复正态性。

对于小数据集,选择参数和非参数检验至关重要(因为非参数检验的功效非常低)。但在小数据集中,正态性检验对非高斯分布的检测力很弱,因此自动方法会让您产生虚假的信心。

对于大型数据集,正态性检验可能过于敏感。正态性检验得出的低P值表明,有强有力证据表明数据并非采样自理想的高斯分布。但您早已知晓这一点,因为几乎没有任何具有科学意义的变量会形成理想的高斯分布。您真正想知道的是,该分布是否偏离高斯理想状态到足以使传统统计检验(这些检验假设数据服从高斯分布)失效的程度。 正态性检验无法回答这个问题。对于大型数据集,即使与理想分布存在微小偏差,也可能导致较低的P值。

何时使用参数和非参数检验是一个艰难的抉择,需要深思熟虑和宏观视野。这一决策不应被自动化。