在某些情况下,GraphPad Prism 可以计算三因素方差分析。但在使用三因素方差分析之前,请注意,它往往远不如大多数科学家所期望的那样有用。当使用三因素方差分析来分析数据时,结果往往无法回答实验设计时所设定的问题。让我们通过一个例子来分析:
研究人员已鉴定出一个在病理条件下对血管生成(新生血管的生长)必不可少的基因。问题在于该基因在脑内是否同样活跃。已知缺氧(低氧水平)会诱导脑内发生血管生成。 因此,问题在于:与正常(野生型,WT)动物相比,敲除该基因(KO)的动物在缺氧刺激下,其血管生成是否会减少。换言之,研究目标是确定KO缺氧小鼠与WT缺氧小鼠在血管生长方面是否存在显著差异。
实验设计:
•一半动物为野生型,另一半则敲除了目标基因。
•一半动物置于正常空气环境中,另一半置于缺氧(低氧)条件下。
•在两个时间点(第1周和第3周)测量大脑特定区域内的血管数量。
该实验包含三个因素:基因型(野生型 vs 敲除型)、氧气(正常空气 vs 低氧)和时间(第1周和第3周)。因此,认为三因素方差分析是合适的分析方法似乎合乎逻辑。三因素方差分析将报告七个P值(即使在进行多重比较检验或对比之前)。这些P值用于检验七个零假设:
•基因型效应。零假设是:在两种条件下(缺氧与否)及所有时间点上,野生型动物的平均结果等于敲除型动物的平均结果。这并没有太大用处。您并不期望敲除型动物在常压空气条件下表现出差异,因此将其与缺氧条件下的结果取平均值只会混淆视听。这个P值没有参考价值。
•缺氧效应。零假设是:对于两种基因型及所有时间点,常压环境下的平均结果与缺氧环境下的平均结果完全相同。我们已知缺氧会诱导野生型动物发生血管生成。本实验的目的是探究缺氧是否对敲除动物产生不同影响。将野生型和敲除动物的结果合并分析并不合理,因此该P值无实际意义。
•时间效应。零假设是:对于两种基因型及两种条件(缺氧与否),两个时间点的平均结果相同。但我们已知血管生成需要时间,因此接受缺氧处理的正常动物在后期时间点的血管生长会比早期时间点更多。将两种基因型和两种条件合并分析并不合理。该P值没有参考价值。
•基因型与缺氧的交互作用。零假设是:在所有时间点上,缺氧对野生型和敲除(KO)动物的影响均相同。这多少切中了研究的核心,也是七个P值中唯一看似能回答实验问题的一个。但即便是这个P值,也并未完全检验您真正关心的零假设。 您真正想知道的是,在缺氧条件下两种基因型是否会导致不同的结果。纳入正常空气条件下收集的数据会混淆结果,而非澄清问题。纳入最早时间点(即血管生成尚未开始之前)的数据同样会模糊结论。
•基因型与时间的交互作用。在两种条件下(缺氧与非缺氧),零假设是两种基因型的差异随时间保持一致。由于实验的全部目的在于探究缺氧的影响,将缺氧动物的结果与呼吸常压空气的动物结果相平均,实际上毫无意义。这个P值毫无用处。
•缺氧与时间的交互作用。将两种基因型合并计算时,零假设是缺氧效应在所有时间点均保持一致。将两种基因型合并计算本身毫无意义,因此该P值毫无用处。
•基因型、缺氧和时间的三因素交互作用。该P值没有参考价值,因为很难确定它所检验的零假设是什么!
为何实验中包含暴露于普通空气的动物?作为对照组。我们预计在三周内,未受应激的动物不会出现显著的血管生成。另一半动物暴露于缺氧环境中,已知缺氧会诱发血管生成。暴露于普通空气的动物作为对照组,用于验证实验是否按预期进行。 因此,我认为将这些结果视为判断实验是否成功、以及缺氧组数据是否值得分析的依据是合理的。如果暴露于普通空气的动物中出现大量血管生成,则可能怀疑存在其他毒素。一旦确认实验有效,这些数据在最终分析中即可忽略。
通过仅分析缺氧组动物的数据,我们只需考虑两个因素:基因型和时间,因此可采用双因素方差分析(two-way ANOVA)进行分析。双因素方差分析会针对三个零假设分别给出三个P值:
•基因型效应。零假设是:合并所有时间点数据后,野生型动物的平均结果等于敲除型动物的平均结果。这切中了实验的核心问题,因此具有实用价值。
•时间效应。零假设是:合并两种基因型后,三个时间点的平均结果相同。但我们已知在正常动物中,晚期时间点的血管生长会比早期时间点更多。我们知道晚期时间点的血管数量多于早期,因此该P值可能较小,这对回答实验问题没有帮助。
•基因型与时间的交互作用。 零假设是:两个基因型之间的差异在所有时间点上都保持一致。如果P值较大,则不会拒绝该假设。在此情况下,基因型的P值回答了实验设计旨在探究的问题。如果P值较小,则会拒绝零假设,并得出结论:不同时间点上基因型之间的差异存在差异。在此情况下,可通过多重比较检验分别比较每个时间点上的两个基因型。
归根结底:利用这些数据,将实验的一半视为验证方法有效的对照组,可以极大地简化数据分析。
统计学家可能会提出异议,认为这些控制数据提供了关于变异性的信息,因此完全忽略这些数据并不公平。精通R或SAS(等)软件的人或许能找到分析全部数据的方法,从而报告出检验特定感兴趣假设的P值。但这绝非易事,且超出了大多数科学家的能力范围。盲目地将数据套入三因素方差分析(ANOVA)中,并不会得出能回答实验问题的结果。
方差分析(即使是双因素方差分析)的一个问题在于,它将这三个时间点与三个物种或三种不同药物处理完全等同对待。
另一种替代分析方法是使用回归分析。最简单的模型是线性模型(而且只有两个时间点,没有必要拟合复杂模型)。使用线性回归来考察缺氧动物的血管生成速率。分别对野生型(WT)动物和敲除(KO)动物拟合一条斜率,然后比较这两条斜率。
在我看来,这种方法最为理想。每个斜率本身作为血管生成速率的度量都易于理解。零假设也清晰明确(即两组速率相同)。这种分析方法更贴近生物学问题,且结果对于非统计学专业人员而言也更容易解读。当然,这假设了在研究的时间范围内血管生成呈线性关系,这一假设是否合理尚待验证。
•仅仅因为实验设计包含三个因素,也不要认为三因素方差分析就是最佳分析方法。
•许多实验设计中都包含阳性或阴性对照。这些对照至关重要,因为它们能让您知道一切是否按预期进行。如果对照组给出了意外结果,那么分析其余数据便毫无意义。一旦验证了对照组按预期工作,这些控制数据通常可以从用于关键分析的数据集中剔除。这能极大简化数据分析。
•当因素为剂量或时间时,拟合回归模型通常比方差分析更能有效解答实验问题。