本页面所述的功能均包含在我们的全新 Pro 和 Enterprise 订阅中。了解更多... |
多因素方差分析(也称为 N 因子方差分析)用于确定响应变量如何受到任意数量的分类因子及其交互作用的影响。例如,您可以测量植物高度对肥料类型、浇水频率、光照和土壤 pH 值的响应。在本示例中,肥料是一个因子,浇水是另一个因子,光照是第三个因子,土壤 pH 值是第四个因子。 请参阅其他内容,了解何时使用多因素方差分析、如何输入数据以及如何解释结果。
多因素方差分析(Multifactor ANOVA)假设您的数据采样自服从高斯分布的总体。虽然根据中心极限定理,在样本量较大时这一假设并不十分重要,但在样本量较小的情况下,它就变得至关重要,尤其是当各组样本量不均等时。
Prism 可以通过“残差”选项卡检测该假设是否被违反。 请检查 QQ 图以确认数据点是否合理地靠近对角线,并运行四种正态性检验(D'Agostino-Pearson检验、Anderson-Darling检验、Shapiro-Wilk检验和 Kolmogorov-Smirnov检验)来评估残差是否近似服从正态分布。但请注意,正态性检验在小样本量下检验力有限,而在大样本量下可能过于敏感。
如果您的数据不符合高斯分布,有几种处理方案。通常最佳选择是对数据进行变换,使其分布更接近高斯分布。例如,对数据取对数或倒数可能有助于解决偏离高斯分布的问题。 另一种选择是仍使用方差分析(ANOVA),因为当样本量较大时,该方法对正态性违背具有相当强的鲁棒性。最后,您也可以使用非参数检验,尽管针对多因素设计,有效的非参数替代方案较为有限。对于单因素比较,建议考虑使用Kruskal-Wallis检验代替方差分析。
方差分析还假设所有总体具有相同的标准偏差(因此方差也相同)。当所有组别的观测值数量相同或接近时,这一假设的重要性较低;但当不同处理组合的样本量存在显著差异时,该假设就变得尤为重要。
Prism 可在“残差”选项卡中检验方差齐性。用于检验异方差性的斯皮尔曼等级相关检验,旨在考察数值较大的单元格是否往往具有更大的变异性。 该检验的 P 值回答了一个关键问题:如果总体方差确实相等,那么随机抽取样本时,其方差出现与观察值同样大差异的概率是多少?较小的 P 值表明方差确实存在差异,因此通常应寻求较大的 P 值。
然而,与所有统计检验一样,不要仅凭 P 值就得出结论。还应查看同方差性图,观察残差分布中是否存在明显规律。 参考其他类似实验的数据。若已有大量先前的证据表明方差确实相等,除非QQ图显示明显问题,否则可按常规解读方差分析结果。部分统计学家建议,当样本量相等或近似相等时,完全忽略等方差检验,因为在均衡设计中,方差分析具有很强的稳健性。
在某些实验情境中,发现方差存在差异可能与发现均值存在差异具有同等重要的科学意义。如果方差确实不同,那么无论方差分析对均值差异得出何种结论,您的总体在根本上都是不同的。
若您得出方差确实不等的结论,请考虑对数据进行转换以稳定方差。对于单因素设计,您可以使用不假设方差相等的Welch方差分析。遗憾的是,这一选项不适用于多因素设计,因此您需要对数据进行转换,或在解释结果时明确指出这一局限性。
多因素方差分析同时检验多个零假设。对于每个因素(主效应),零假设认为:当忽略其他所有因素的影响时,该因素所有水平的均值相等。对于每个交互作用,零假设认为不存在交互作用 - 换言之,一个因素的影响在另一个或多个因素的所有水平上均保持一致。
每次检验的 F 统计量计算为:归因于该效应的方差与残差变异之比。当该比值较大时,表明在数据中随机变异量的情况下,该效应是真实存在的。随着 F 统计量增大,相应的 P 值会减小。如果 F 统计量足够大(导致 P 值小于预设的 α 值),则可以拒绝该效应的零假设。
这里有一个关键点:如果交互作用显著,在单独解读主效应时务必格外谨慎。显著的交互作用意味着一个因子的效应确实依赖于另一个因子的水平。在这种情况下,诸如“因子A增加了响应”或“因子B没有影响”之类的陈述可能会产生误导或不够全面。相反,应使用单因素效应比较来理解各因子是如何相互作用的。 例如,分别比较因子 B 的每个水平下因子 A 的各水平。
多因素方差分析(ANOVA)通过将组平均值之间的差异与各组的合并标准偏差进行比较来运作。这种方法假设所有观测值都是独立的。换言之,每个观测值来自不同的受试者或实验单位,且不同组之间的观测值之间不存在关联。
当对同一受试者进行多次测量,或受试者基于特定特征相互配对时,这被称为“重复测量”或“配对”设计。如果您的数据为配对数据或涉及重复测量,则需要使用重复测量方差分析。若您的一个或多个因素涉及重复测量,请使用专门的重复测量单因素方差分析、重复测量双因素方差分析或三因素方差分析。 Prism 当前的多因素方差分析不支持重复测量方差分析。
当配对能有效控制实验变异性时,重复测量方差分析的检验力将高于普通方差分析,因为它考虑了相关测量值之间的相关性。
“误差”一词指每个观察值与模型针对该因子组合所预测均值之间的差值。多因素方差分析的结果仅在该散布真正随机时才有意义。换言之,当导致某个值过高或过低的任何因子仅影响该单一值,且不会在各值之间产生相关性时,分析结果才成立。
Prism无法为您检验这一假设:您必须仔细考虑实验设计。例如,假设每种处理组合有六个数值,但这六个测量值仅来自两名受试者,且每位受试者进行了三次重复测量。在这种情况下,某些未知因素可能会导致某位受试者的三次测量值始终偏高或偏低。这属于伪重复,普通的多因素方差分析并不适用。
真正的重复样本是相互独立的实验单元。如果您的“重复样本”来自同一受试者、同一细胞培养制备物或同一实验运行,它们就不是独立的。在这种情况下,您应在分析前对技术重复样本进行平均,或使用能考虑数据分层结构的重复测量或混合模型方法。
多因素方差分析(ANOVA)用于比较不同组间的均值。即使不同组的分布存在显著重叠,仍可能得到极小的P值。在某些研究情境中(如评估诊断试验的实用性),您可能更关注分布的重叠程度,而非均值之间的差异。方差分析无法直接揭示这种重叠情况。
此外,方差分析仅检验均值是否存在差异,但不会自动告知差异程度或该差异在实践中是否重要。统计学显著结果意味着您拥有真实差异的有力证据,但该差异可能微乎其微且在生物学上毫无意义。除P值外,务必同时考察效应量(解释变异量的百分比、偏η²、Cohen's f),以评估效应是否存在及其大小或重要性。
不要将多因素方差分析与恰好包含多个组别的单因素方差分析混为一谈。多因素方差分析中,存在三个或更多分组变量(因素) - 例如肥料类型、浇水频率和光照强度。而单因素方差分析中,仅有一个分组变量(例如处理类型)。即使有五种不同的处理,仍需使用单因素方差分析,而非五元方差分析。
同样地,当一个因子有四个水平、另一个因子有三个水平时,这仍然是双因素方差分析(两个因子),而非七因素方差分析。所谓“因素数”指的是您正在研究的因子(分组变量)的数量,而非所有因子中组别或水平的总数。
虽然多因素方差分析在理论上可以处理任意数量的因素,但实际考虑会限制单次分析中应包含的因素数量。
随着因子的增加,样本量要求呈指数级增长。三个因子各设三个水平会产生27种处理组合;四个因子各设三个水平则产生81种组合;五个因子各设三个水平将产生243种组合。若要确保足够的重复次数(例如,每种组合需5-10个观测值以获得合理的检验力),很快就会需要一个不切实际的大样本量。
随着因子的增加,结果的解读也变得日益复杂。因子越多,需要理解和解释的主效应及交互作用就越多。一个四因子设计会产生14种不同的效应需要检验:4个主效应、6个双因素交互作用、4个三因素交互作用,以及可能存在的1个四因素交互作用。众所周知,三因素及以上的高阶交互作用在生物学意义上极难进行有意义的解读。
请仔细考虑所有因素是否确实对回答您的研究问题必不可少。应包含具有主要科学价值的因素,以及用于控制已知混杂变量的因素。如果潜在因素众多,建议先采用筛选设计来确定哪些因素最重要,再进行包含所有组合的完全因子实验。
最后再次提醒,高阶交互作用不仅会增加实验所需的样本量,而且其解读难度极高。目前对于多因素方差分析,Prism 仅支持最高三阶交互作用(即方差分析模型中三个不同因素之间的交互作用)。
Prism 中的多因素方差分析允许您检验所有主效应(每个单独因素的影响)、所有双向交互作用(每对因素的组合效应)以及所有三向交互作用(每组三个因素的组合效应)。
然而,四因子及以上阶交互作用并不在检验范围内。这些高阶交互作用极难解读,在实际应用中极少显著,且需要非常大的样本量才能以足够的检验力检测到,同时往往与有意义的生物学机制不符。原本应归因于四因子及以上交互作用的变异,会被合并到残差(误差)项中。
如果您有充分理由需要检验四因子或更高阶交互作用,请咨询统计学家,了解可处理此类更复杂模型的替代方法或专用软件。
在 Prism 中进行多因素方差分析(ANOVA)需要使用“多变量”数据表。这与用于单因素方差分析和双因素方差分析的“列”或“分组表”不同。
在“多变量”表格中,每行代表一个观测值(一个受试者、样本或实验单位),每列代表一个变量。您需要为响应变量(您正在测量的连续结果)设置一列,并为分组变量(定义处理组的分类因子)设置额外列。
如果您的数据当前处于“列”或“分组表”中,您需要将其重新组织为“多变量”表格,才能运行多因素方差分析。有关如何正确设置表格的详细指导,请参阅“输入多因素方差分析数据”。
多因素方差分析要求所有分组变量(因子)均为分类变量。这意味着它们必须定义不同的组或条件,而非表示连续测量值。
合适的因子包括:当您将其视为不同类别时,如治疗组(对照组、药物A、药物B)、基因型(野生型、杂合子、敲除型)、地点(地点A、地点B、地点C)或时间点(0小时、6小时、12小时、24小时)。这些均代表组间离散的定性差异。
不适用于多因素方差分析的变量包括:以连续尺度测量的年龄、体重或剂量等连续预测变量,以及当您希望将其作为连续进程而非离散类别进行分析的时间变量。若存在连续预测变量,请改用多元线性回归。多元线性回归也可处理分类变量与连续预测变量的混合,但其对分类变量的编码方法与方差分析不同。
有一个特例值得提及:有序分类因子,例如剂量水平(0、10、25、50 毫克)或时间点。您可以将这些纳入方差分析,但需注意方差分析会将其视为无序类别,并忽略各水平之间的数值关系。如果顺序或间隔对您的研究问题至关重要,请考虑使用回归分析,将该预测因子建模为连续变量。
多因素方差分析要求因变量为连续型:即以间隔尺度或比率尺度测量的结果,且数值差异具有实际意义。
合适的因变量包括物理测量值(身高、体重、长度)、生化测量值(浓度、表达水平)、时间测量值(时间、速率、频率),或任何数值间隔具有一致含义的数值测量。
方差分析不适用于分类型结果(患病/健康、阳性/阴性)。此类结果变量需要采用不同的检验方法,例如卡方检验或逻辑回归。二元结果(是/否、存活/死亡)同样需要逻辑回归。包含大量零值的计数数据可能违反方差分析的假设,此时可能需要采用Poisson回归。
Prism 执行的是 III 类方差分析,即固定效应方差分析。该方法用于检验您收集数据的特定组(水平)之间的组平均值差异。
当您刻意选择特异性组别进行研究(如特定药物剂量或特定基因型)、希望针对这些特异性组别而非更广泛的人群得出结论,或者您的组别代表了您关注的所有水平(或至少是完整的感兴趣集合)时,固定效应是合适的。
在另一种情境下,随机效应更合适:如果您是从大量可能的组中随机选取组,并且希望将研究结果推广到所有可能的组,而不仅仅是研究中的那些组。例如,如果您从一个地区的所有诊所中随机选取了几家,并希望对诊所总体进行推断,而不仅仅是针对您的特定样本,那么您需要使用随机效应。
随机效应模型需要不同的计算方法。Prism的多因素方差分析(ANOVA)目前假设所有因子均为固定效应,但未来将扩展功能以支持随机效应。
多因素方差分析用于检验组平均值是否存在差异,但这与检验各组在所有方面是否完全相同、效应是否显著、特异性组是否“最佳”,或导致差异的机制是什么,并非同一回事。
方差分析能告诉您:是否有统计学证据表明您的因素影响了结果;哪些因素及交互作用显示出统计学显著效应;以及每个效应解释了多少方差。 方差分析无法直接告诉您的内容:哪些具体组之间存在差异(这需要进行多重比较);差异在实际层面的大小(需检查效应量和置信区间);差异是否具有生物学或临床意义(这需要超越统计学的科学判断);以及组间差异的原因(方差分析能检测模式,但无法解释机制)。
在方差分析中发现显著效应后,请使用多重比较检验来确定哪些具体组之间存在差异。通过考察效应量来评估差异是否足够大以值得关注。结合生物学背景来判断统计学显著差异是否也具有科学意义。
在信任 ANOVA 结果之前,请通过“残差”选项卡检查假设。
生成三张诊断图:残差图(应显示围绕零点的随机散布)、同方差性图(应显示离散度无趋势)以及QQ图(点应紧邻对角线)。若需客观指标,请运行诊断试验:斯皮尔曼异方差检验用于检查方差不齐,四种正态性检验则用于评估残差是否服从正态分布。
请在这些诊断图中查找问题:残差中的模式(呈曲线或漏斗状而非随机分布)、远离数据点主聚类的异常值、QQ图显著偏离对角线表明的非正态分布,或同方差性图中可见的组间方差不均。
若假设不成立,请考虑对数据进行变换(对数或平方根变换通常有效),承认分析的局限性并谨慎进行,或采用更适合数据结构的替代分析方法。