Please enable JavaScript to view this site.

Navigation: 统计学原理 > 分析核查清单

分析核查清单:单因素方差分析

Scroll Prev Top Next More

单因素方差分析用于比较三个或更多个非配对组的组平均值。本检查清单专门用于执行不包含重复测量的单因素方差分析。重复测量方差分析有单独的检查清单。有关如何选择检验方法解释结果的内容,请参阅其他资料。

总体是否服从高斯分布?

单因素方差分析(ANOVA)假设数据是从服从高斯分布的总体中抽取的。虽然根据中心极限定理,在样本量较大时这一假设的重要性并不显著,但在样本量较小(尤其是样本量不均等)的情况下,该假设至关重要。Prism 可以检验该假设是否被违反,但正态性检验的实用性有限。

如果您的数据不来自高斯分布,您有三种选择。最佳方案是对数据进行变换(例如取对数或倒数),以使分布更接近高斯分布。另一种选择是使用Kruskal-Wallis检验代替方差分析。最后一种选择是尽管如此仍使用方差分析,因为在大样本情况下,该方法对高斯分布的违背具有相当强的鲁棒性。

各总体是否具有相同的标准偏差?

单因素方差分析(ANOVA)假设所有总体具有相同的标准偏差(因此方差也相同)。当所有组别受试者数量相等(或几乎相等)时,这一假设并不十分重要;但当样本量存在差异时,该假设就变得至关重要。

Prism 通过两种检验来检验方差是否相等:布朗-福赛斯检验(Brown-Forsythe test)和巴特利特检验(Bartlett's test)。这些检验得出的 P 值回答了以下问题:如果总体方差确实相等,那么随机抽取样本时,其方差之间出现与实验中观察到的差异程度相同的概率是多少。较小的 P 值表明方差存在差异。

不要仅凭这些检验得出结论。还应参考其他类似实验的数据。如果您有大量既往数据能让您确信方差确实相等,则忽略这些检验(除非 P 值极小),并按常规解读方差分析结果。一些统计学家建议,如果样本量相等(或几乎相等),则完全忽略等方差检验。

在某些实验情境中,发现方差不同可能与发现均值不同同样重要。如果方差不同,则总体不同 - 无论方差分析对均值差异得出何种结论。

您是否检验了正确的假设?

该检验的零假设是所有组的均值相等。 该检验的F统计量是组平均值与组内方差之比。若该统计量较大,则表明各组平均值不相同(在考虑各组内部数据方差程度的前提下)。随着F统计量增大,相应的P值会减小。若F统计量足够大(即P值足够小),即可拒绝该零假设。

数据是否为非配对数据?

单因素方差分析(ANOVA)通过将组平均值之间的差异与各组的合并标准偏差进行比较来运作。如果数据是配对的,则应选择重复测量方差分析。如果配对能有效控制实验变异性,则重复测量方差分析的检验力将高于普通(或常规)方差分析。

“误差”是否相互独立?

“误差”一词指每个数据值与组平均值之间的差值。单因素方差分析的结果仅在数据散布具有随机性时才有意义 - 即导致某个值过高或过低的因素仅影响该单一值。Prism无法检验这一假设。 您必须考虑实验设计。例如,如果每个组有六个数值,但这些数值来自每个组的两只动物(各测三次),则误差不独立。在这种情况下,某些因素可能导致同一只动物的所有三次测量结果都偏高或偏低。

您真的想比较均值吗?

单因素方差分析(One-way ANOVA)用于比较三个或更多组的平均值。即使分布之间存在显著重叠,仍可能得到极小的 P 值 - 这清楚地表明总体平均值存在差异。在某些情况下 - 例如评估诊断试验的有效性 - 您可能更关注分布之间的重叠程度,而非平均值之间的差异。

是否仅有一个因素?

单因素方差分析用于比较由单一因素定义的三个或更多组。例如,您可以比较对照组、药物治疗组以及药物联合拮抗剂治疗组。或者,您可以将对照组与其他五个分别接受不同药物治疗的组进行比较。

有些实验涉及多个因素。例如,您可能比较男性和女性中三种不同的药物。该实验中有两个因素:药物治疗和性别。这些数据需要通过双因素方差分析(也称为二元方差分析)进行分析。

该因子是“固定因素”还是“随机因素”?

在计算普通单因素方差分析时,Prism 执行的是固定效应方差分析。这用于检验您所收集数据的特定组别之间组平均值的差异。 另一种称为随机效应方差分析的检验方法则假设:您是从无限(或至少是大量)可能的组中随机选取了若干组,并且您希望得出关于所有组之间差异的结论,即使包括那些未纳入本次实验的组。这种随机效应方差分析很少使用,且 Prism 不支持该功能。

不同的列是否代表分组变量的不同水平?

单因素方差分析旨在检验三个或更多组中单个变量的值是否存在显著差异。在 Prism 中,需将每个组数据分别输入到独立的列中。如果不同列代表的是不同的变量而非不同的组,则单因素方差分析并不适用。例如,若 A 列为葡萄糖浓度、B 列为胰岛素浓度、C 列为糖化血红蛋白浓度,此时单因素方差分析将无法提供有效分析。