双因素方差分析的计算方法相当标准,本文仅针对其中的一些模糊拟合之处进行讨论。
要理解固定因素与随机因素的区别,不妨考虑一个比较三个物种在三个时间点上反应的示例。如果您关注的是这三个特定物种,那么物种就被视为固定因素。如果您关注的是物种之间的普遍差异,并且是随机选取了这三个物种,那么物种就是随机因素。如果您选择的时间点覆盖了您感兴趣的时间区间,那么时间就被视为固定因素。 若您是随机选取这三个时间点,则时间即为随机因素。由于这种情况不太可能发生,因此时间几乎总是被视为固定因素。
当行变量和列变量均为固定因素时,该分析称为 I 型方差分析。当行变量和列变量均为随机因素时,该分析称为 II 型方差分析。当其中一个为随机因素、另一个为固定因素时,则称为混合效应模型(III 型)方差分析。在无重复测量的情况下,Prism 仅计算 I 型双因素方差分析。由于大多数实验涉及固定因素变量,因此这很少构成限制。
若存在缺失值,双因素方差分析的计算将变得颇具挑战性。David Lane在其在线教材中对双因素方差分析中缺失值带来的挑战给出了非常清晰的解释。
Prism采用Glantz和Slinker(1)详细阐述的方法。该方法将方差分析问题转化为多元回归问题,随后以方差分析的形式呈现结果。Prism会执行三次多元回归 - 每次将列、行和交互作用以不同的顺序提交给多元回归程序。 尽管 Prism 计算了三次各自由度的平方和,但仅显示最后输入到多元回归方程中的因子的平方和。这些被称为第三类平方和。本文解释了第一类、第二类和第三类平方和的区别。第二类平方和假设不存在交互作用。第一类和第三类仅在存在缺失值时才有所不同。
如果存在任何缺失值,Prism 无法执行重复测量方差分析。各组受试者数量不同是可以的,只要每个受试者在每个时间点或剂量下的数据都是完整的。
若数据为平衡设计(各处理条件样本量相等),无论输入原始数据,还是输入均值、标准差(或标准误)及样本量,所得结果均相同。若数据为非平衡设计,则无法通过均值、标准差(或标准误)及样本量计算出精确结果。此时,Prism将采用一种称为“非加权均值分析”的简化方法。 该方法详见 LD Fisher 和 G vanBelle 所著《生物统计学》(John Wiley,1993)。若所有组别的样本量相同,以及在某些其他特殊情况下,这种简化方法得出的结果与分析原始数据完全一致。
如果各组的样本量不一致,这些结果仅为近似值。如果数据几乎平衡(仅有一个或几个缺失值),该近似值是可靠的。当数据不平衡时,应尽可能输入单个重复数据,并避免输入均值、n 以及标准差或标准误。
David Lane 在其在线教材中也讨论了未加权均值法。
即使您仅为每个列/行组合输入了一个重复值,Prism 仍可执行双因素方差分析。此类数据不允许您检验行与列之间的交互作用(除非测量重复值,否则无法区分随机变异性与交互作用)。相反,Prism 会假设不存在交互作用,仅检验行效应和列效应。如果该假设不成立,则行效应和列效应的 P 值将失去意义。
SA Glantz 和 BK Slinker,《应用回归与方差分析入门》,McGraw-Hill,1990年。