每次方差分析都会生成一个方差分析表,该表将变异分解为各个成分。理解该表是解释结果的关键。
变异来源 |
所代表的含义 |
组间(或因子效应) |
由组平均值差异引起的变异 |
组内(或残差/误差) |
各组内因个体差异导致的变异 |
总变异 |
所有数据合并后的总变异 |
•平方和 (SS):量化每个来源的变异量
•自由度 (df):独立信息的数量
•均方 (MS):SS 除以 df - 代表各来源的方差
•F值:组间均方(MS(between))除以组内均方(MS(within)) - 检验统计量
•P值:假设各组之间确实相等时,观察到该F值(或更大值)的概率
F ≈ 1:组间变异与组内变异相当(无效应)
F >> 1:组间变异远大于组内变异(可能存在效应)
当存在两个或多个因素时,方差分析(ANOVA)可检验它们之间的交互作用。当一个因素的效果依赖于另一个因素的水平时,即发生交互作用。
交互作用效应指一种情况,即一个因子的效应依赖于另一个因子的值(或水平)。通过以下示例可以更好地理解这一点:
无交互作用的例子:一种药物能使男性和女性的血压均降低 10 点。无论性别如何,该药物的效应都相同 - 不存在交互作用。
存在交互作用的例子:一种药物能使男性的血压降低20点,但仅使女性的血压降低5点。该药物的效应取决于性别 - 这属于交互作用。
在多因素实验中,交互作用往往是最引人注目的发现。它们表明:
•效应并非简单或可相加的
•若不考虑其他因素,便无法完全理解单一因素
•可能需要进行亚组分析
•双因素交互作用:两个因素之间的交互作用(A × B)
•三因子交互作用:三个因子之间(A × B × C)
•高阶交互作用:四因子及以上(解读难度逐渐增加)。请注意,即使在多因素方差分析中,Prism也仅支持包含三因子交互作用(如适用)。
方差分析(ANOVA)能告诉您是否至少有一个组别与其他组别存在差异,但无法指出具体是哪些组别存在差异。多重比较检验(也称为事后检验)可以解答这一问题。
假设进行一项比较五个不同组别的单因素方差分析。若该分析得出的 F 统计量对应的 P 值小于指定的显著性水平阈值(通常为 0.05),则会拒绝“各组之间均等”的零假设。然而,此时无法得知:
•所有五个组之间是否彼此不同
•仅有一组与其他所有组不同
•各组是否分为两组或三组
多重比较(事后)检验可帮助您探究这些不同的可能性。
比较所有组间的两两关系
•Tukey检验(最常见)
•Sidak检验
•Holm-Sidak检验
将每个组与对照组进行比较
•Dunnett检验
Prism多因素方差分析的多重比较
•主效应:比较单个指定因子内的组别,并跨所有其他因子取平均值
•简单效应:比较单一因子下、第二个因子处于指定水平的组别,并取其余所有因子的平均值
•逐个单元格比较:比较所选因子的所有独特组合,并求其余因子的平均值。所选因子的独特组合定义了待比较的组,这些组的数值在其余因子上求平均值。
所有统计检验都会对数据做出假设。当假设不成立时,结果可能不准确。以下是方差分析的关键假设:
1.观测值的独立性
假设:每个观测值与其他所有观测值相互独立。一个测量值的数值不会影响任何其他测量值。
当该假设不成立时:
•对同一受试者进行重复测量(应改用重复测量方差分析)
•聚类数据(例如,来自同一动物的多个细胞,同一教室的学生)
•连续测量值之间存在相关性的时间序列数据
应对措施:在适当情况下,使用重复测量方差分析(ANOVA)或嵌套方差分析模型来处理这种非独立性。
2. 正态性
假设:各组中的值均来自服从正态(高斯)分布的总体。
这有多重要?
•当样本量较大(每组 n > 30)时,方差分析(ANOVA)对非正态性具有很强的鲁棒性
•对于小样本量或样本量不均等的情况,非正态性会带来更多问题
•极端异常值或高度偏斜度的数据可能会造成问题
正态性检验:
•Prism 可以生成正态性检验和 Q-Q 图
•通常,对残差进行目视检查最为有效
•请记住:您检验的是总体是否服从正态分布,而不仅仅是样本
若偏离正态分布该怎么办:
•若数据呈正偏斜度,可考虑使用对数正态方差分析
•对数据进行变换(对数、平方根、倒数),然后重新运行方差分析
•采用非参数替代方法(Kruskal-Wallis检验、Friedman检验)
•若样本量较大,仍可进行方差分析(因其具有鲁棒性)
3.方差齐性(方差相等)
假设:所有组均来自方差相等(标准偏差相等)的总体。
等方差检验:
•Prism 会自动报告Brown-Forsythe检验和巴特利特检验(配合单因素方差分析)
•Brown-Forsythe检验更具稳健性,通常更受青睐
•较小的 P 值表明方差不齐
这有多重要?
•当样本量不相等时,这一点更为重要
•当样本量相等且较大时,方差分析(ANOVA)具有相当强的稳健性
•在样本量较小时问题较多
若出现偏差该怎么办:
•对数据进行变换以使方差相等
•使用韦尔奇(Welch)或Brown-Forsythe(Brown-Forsythe)单因素方差分析(仅限单因素)
•考虑方差不齐本身是否构成重要发现
•使用非参数检验(尽管这些检验也假设方差相等)
4.球面性(仅限重复测量)
假设:所有重复测量两两间差值的方差相等。
适用情况:仅适用于包含三个或更多重复测量变量的重复测量方差分析。
示例:若在时间点 1、2、3 和 4 对受试者进行测量:
•(时间1 - 时间2) 的方差应等于 (时间1 - 时间3) 的方差
•应等于 (时间1 - 时间4)、(时间2 - 时间3) 等的方差
球面性检验:
Prism 报告 Epsilon (ε) 值以量化偏离程度
•ε = 1.00:满足假设
•ε < 0.75:严重偏离
若出现违背该如何处理:
•在分析对话框中不要假设球面性
•Prism 将自动应用 Greenhouse-Geisser修正
•该校正会减少自由度,使检验结果更保守(P 值增大)
•使用多个 t 检验代替方差分析(ANOVA)(会提高假阳性率)
•忽略实验设计(在应使用重复测量方差分析时却使用普通方差分析)
•忘记检查假设(尤其在小样本情况下)
•过度解读无显著性结果(无证据 ≠ 证据于无)
•仅关注P值(应同时报告效应量和置信区间)
•纳入过多因素(模型可能很快变得难以解释;应考虑更简单的设计)
•将有序因子视为无序因子(时间、剂量等变量通常应采用回归分析或趋势检验)
•未可视化交互作用(仅靠表格无法清晰展示交互作用)