确定何时使用非参数检验并非易事。以下是一些需要考虑的因素:
•超出量程的值。在某些类型的实验中,可能会有一个或几个值“超出量程” - 即数值过高或过低而无法测量。即使总体服从正态分布,也无法使用t检验或方差分析(ANOVA)来分析这些数据。如果完全排除这些超出量程的值,将会导致结果产生偏差;如果对这些值进行估算,t检验的结果将很大程度上依赖于您的估算值。 解决方法是使用非参数检验。对于过低而无法测量的数值,赋予其一个任意的低值;对于过高而无法测量的数值,赋予其一个任意的高值。由于非参数检验仅分析秩,只要您输入的数值使这些值具有正确的秩,即使您不知道其中一个(或几个)数值的精确值,也不会造成影响。
•数据转换可将非高斯分布转化为高斯分布。若您确信数据不服从高斯分布,在选择非参数检验前请三思。不妨考虑对数据进行转换,例如使用对数或倒数。通常,简单的转换就能将非高斯数据转化为高斯分布。随后,使用常规检验对转换后的数值进行分析。
•非连续数据。结果仅为包含少数几个类别的排名或分数。显然,在这些情况下总体分布远非正态。使用非参数检验的问题在于,会有大量数值并列同一排名。虽然非参数检验内置了处理并列排名的特殊校正机制,但我无法确定当并列排名数量庞大时这些机制的效果如何。另一种替代方案是进行卡方检验。
•样本量小。如果样本量极小(每组仅有少数受试者),非参数检验力几乎为零或完全为零,无法发现显著差异。
•不应仅凭正态性检验结果来自动决定是否采用非参数检验,但这些检验可作为决策的参考依据。
•您真的应该在实验设计阶段就确定统计检验方法。如果您只是试着做这个检验,再试那个检验,直到得到满意的结果,很可能会被误导。