Please enable JavaScript to view this site.

效应量与P值:解读不同,但同样重要

效应量量化了方差分析(ANOVA)中各组之间的差异程度,提供了仅凭P值无法获取的信息。传统上,P值一直是统计结果的核心关注点,因为它揭示了效应是否统计学显著。然而,这一概念常被误解。

实际上,“统计学显著”的结果并不能说明效应有多大或有多重要。相反,P值仅仅反映了在零假设成立的情况下,观察到与当前数据同样极端(或更极端)的数据的概率。 例如,P值为0.05意味着在“无效应”这一零假设成立的情况下,类似于所观测到的数据(以及由此确定的效应)出现的概率约为5%。虽然这无疑是有用的信息,但它并未说明效应本身的大小或实际重要性。相反,它仅回答了一个问题:即在没有真实效应的情况下,所观测到的效应是否能与预期的随机噪声水平区分开来。

这就是效应量发挥作用的地方。P值关注的是效应相对于随机变异性是否可检测,而效应量则描述该效应的大小。一个统计学显著的结果(即P值较小)可能对应着一个非常微小且在实践中不重要的效应,特别是在大样本量的情况下。反之,一个无统计学显著的结果仍可能反映出一个实质性的效应,只是研究缺乏足够的检验力来可靠地检测到它。 效应量有助于您评估研究结果的实际意义及其大小。

Prism报告的效应量

Prism 会根据您执行的方差分析 (ANOVA) 类型以及所选的分析选项,报告多种不同的效应量指标。

R²(决定系数) - 模型解释的方差比例

η²(η平方 - 相关因子或预测因子解释的方差比例

偏η²(Partial η²,ηp²) - 在考虑模型中其他因子或预测因子后,相关因子/预测因子所解释的方差比例

Cohen's f - 标准化效应量,表示解释方差与误差方差之比

R²(R平方)表示整个模型(所有因素或预测变量)解释了因变量总方差中的比例。从计算角度来看,该效应量通常等同于η²,尽管不同领域可能更倾向于使用其中一种指标来报告结果。

 

其中:

SSmodel 是模型的平方和

SStotal 是总平方和

单因素方差分析中的R²

在单因素方差分析中,模型中仅包含一个因素(处理或分组变量),因此模型仅包含一种效应。因此,R² 可以写成几种完全等价的形式:

 

由于在单因素方差分析中

 

 

 

 

 

需要再次强调的是,这种替代形式仅适用于单因素方差分析。但对于此类设计,R² 在数学上等同于 η² 和偏 η²。

解读

R²的取值范围为0到1(或0%到100%)。数值为0.25意味着数据中25%的总变异量由模型(所有因子及交互作用)解释。Prism在以下位置报告方差分析的R²值:

单因素方差分析 - 该效应量量化了组别归属与测量响应变量之间的关系强度。由于仅有一个因素,模型的R²值即等于该效应的η²值

重复测量方差分析 - 此处报告两个 R² 值

1. 处理效应:此处的 R² 定义为 。这将个体/受试者的平方和从方程中剔除,从而聚焦于相对于随机误差的组别或处理效应方差。在此情况下,该计算等同于偏 η²

2. 配对有效性:此处的R²定义为。这量化了总方差中有多少比例归因于受试者之间的一致性差异。

η²

本节所述的功能和特性可在我们的全新 Pro 和 Enterprise 订阅中使用。了解更多...

η² 量化了方差分析(ANOVA)中归因于特定个体效应(如主效应/主要因素或交互作用项)的总方差比例。与描述整个模型的 R² 不同,η² 是针对分析中的每个效应分别计算的。

对于方差分析中的任何特异性效应:

 

其中:

SSeffect 是该特异性效应(如主效应或交互作用项)的平方和

SStotal 是数据中的总平方和

eta² 的取值范围为 0 到 1(0% 到 100%),表示特异性效应解释了总方差中的多少比例。

与单因素方差分析中 R² 的关系

在单因素方差分析中,仅存在一个效应(分组因子),因此:

主效应的eta平方等于模型的R平方

由于仅需评估一个效应,因此这两个数值在数值上完全相同

即使数值相同,这些效应量的解读仍存在细微差异

在因子设计(双因素方差分析、三因素方差分析或多因素方差分析)中,每个效应都有其自身的η²值,这些值与总体模型的R²不同。

偏η²(partial η²

本节所述的功能和特性可在我们的全新 Pro 和 Enterprise 订阅中使用。了解更多...

部分η²通常用于因子方差分析设计(双因素方差分析、三因素方差分析或多因素方差分析)。与以总方差为分母的η²不同,部分η²仅使用与所考察效应相关的方差。

对于方差分析中的任何特异性效应:

 

其中:

SSeffect 是该特异性效应(如主效应或交互作用项)的平方和

SSerror 是残差(误差)平方和

该公式的分母揭示了偏eta平方所回答的问题。总平方和等于方差分析模型中各组成部分(主效应和交互作用)的平方和之和,再加上误差或残差的平方和。 因此,如果eta²回答的是“该效应解释了总方差的多少比例?”,那么偏eta²则回答相关问题:“在其他效应无法解释的方差中,该效应解释了多少比例?”。换言之,偏eta²是在首先考虑模型中所有其他效应之后,为ANOVA模型中的每个效应提供的效应量。

这使得偏eta²特别适用于:

比较设计相似的不同研究中的效应量

理解每个因子的独特贡献

需要独立评估各因子的因子设计

偏eta平方的取值范围为0到1(0%到100%),表示该特异性因素解释了模型中其他因素无法解释的方差中的多少比例。

Cohen's f

本节所述的功能和特性仅在我们的全新 Pro 和 Enterprise 订阅中提供。了解更多...

Cohen's f 是另一种效应量指标,在检验力和样本量计算中尤为有用。对于任何给定的效应,Cohen's f 源自以下相关定义:

这实际上使量值 f² 成为一种信噪比。 此前我们已说明,偏η²是扣除其他效应贡献后,该效应所解释的方差比例。既然已知其他效应的贡献已被剔除,那么仅剩的方差来源必然是该效应所解释的方差与误差方差。因此,若 ηp² 代表该效应所解释的方差,则 1-ηp² 必然是误差方差!由此可得:

部分η²告诉我们相关变异中有多少比例归因于效应。Cohen's f 只是将这一信息以信噪比的形式表达出来,而非比例。正因这种数学转换,Cohen's f 的取值不再局限于 0 到 1 之间。

通常,您会看到基于某些标准值的Cohen's f评估:

Cohen's f

解读

等效的偏eta平方

0.10

小效应

0.0099(约1%)

0.25

中等效应

0.0588(约6%)

0.40

大效应

0.1379(约14%)

必须牢记,虽然这些解读指南在许多情况下很有用,但何谓“小”、“中”或“大”效应,在不同领域甚至不同实验中可能存在巨大差异。这些标准指南不能完全替代您对所从事研究领域的知识和理解。