本页面所述的功能均包含在我们的全新 Pro 和 Enterprise 订阅中。了解更多... |
运行多因素方差分析后,Prism 将生成两张主要结果表:
1.表格结果 - 包含方差分析表和描述性统计
2.多重比较 - 包含事后检验结果(如您已请求执行)
本页面将引导您解读输出结果的各个部分,并帮助您理解结果的含义。
“表格结果”页面包含多个部分。本页将以一种实验设计为例,逐步讲解各部分内容,该设计中测量了在不同施肥和灌溉条件(因子)下的植株高度(响应变量)。
本部分仅标明用于分析输入的数据表。
本部分提供分析的概述信息,包括分析类型(普通方差分析或重复测量方差分析)(注:Prism 目前尚不支持多因素重复测量方差分析),以及分析中设定的显著性水平(α值)。
这是最重要的部分之一。它展示了每个因子及交互作用的效应量和显著性。以下是该部分在Prism中的示例
变异来源 |
总变异百分比 |
η² |
部分η² |
Cohen's f |
P值 |
P值汇总 |
显著吗? |
|---|---|---|---|---|---|---|---|
肥料 |
41.50244 |
0.4150244 |
0.7543390 |
1.752327 |
<0.0001 |
**** |
是 |
浇水 |
36.84483 |
0.3684483 |
0.7316190 |
1.651074 |
<0.0001 |
**** |
是 |
肥料:浇水 |
8.136888 |
0.08136888 |
0.3757903 |
0.7759031 |
<0.0001 |
**** |
是 |
变异来源
列出每个被检验的因子及交互作用:
•肥料 - 肥料的主效应
•浇水 - 浇水的单因素效应
•肥料:浇水 - 肥料与浇水之间的双因素交互作用
总变异百分比
提供每个效应解释响应变量总变异性的百分比。以上例而言:
•植株高度变异量的41.5%由肥料类型解释
•36.8% 由灌溉频率解释
•8.1% 由肥料 × 浇水交互作用解释
这些数值的一般解读是:较大百分比(>30-40%)代表强效应,而中等或较小百分比可能代表不明确或弱效应。重要的是,由于这些百分比是根据第三类平方和计算得出的,它们的总和可能不为100%(在此方法中,主效应可能共享方差)。此外,虽然较小百分比可能代表弱效应,但在样本量较大时,这些效应仍可能被发现统计学显著。
η²(Eta-Squared)
η²(Eta-Squared)是一种效应量,表示每个效应所解释的总方差比例。数学上,它等同于:
此外,它与总变异百分比(如上所述)之间存在如下关系:
一般解读准则:
•η² = 0.01 - 小效应
•η² = 0.06 - 中等效应
•η² = 0.14 - 大型效应
在报告结果时,应始终同时报告 P 值和效应量。
偏η²(偏η²)
与 η² 类似,偏 η² 是一种效应量估计值,表示在模型中控制其他效应后,每个效应所解释的方差比例。数学上:
一般解读准则与上述η²类似,但具体含义略有不同。 对于 η²,一种解读可能是:“在我的实验中,肥料类型解释了植株高度方差的 41%。”相比之下,对偏 η² 的类似(但有区别)解读则是:“在控制了灌溉方法以及灌溉与肥料类型交互作用导致的植株高度方差后,仅肥料类型这一因素就解释了植株高度方差的 75%。”
科恩的f值
这是方差分析(ANOVA)中常用的效应量指标,表示组间变异性(组平均值的分散程度)与组内变异性(各组内观测值的分散程度)之比。 如果存在效应,可以预期组间变异性会大于组内变异性,从而导致Cohen's f的值更大。事实上,这通常也是该效应量值的解读(Cohen's f值越大,代表效应越大或越强)。数学上:
一般解读准则:
•f = 0.10 - 小效应
•f = 0.25 - 中等效应
•f = 0.40 - 大效应
P值
大多数研究者最熟悉的统计量(尽管并非总是最被理解的值!)是 P 值。该值代表在总体中确实不存在效应的情况下,观察到给定因素效应大小等于(或大于)所测定值这一结果的概率。换言之,这是仅因从不存在效应的总体中随机抽样,便会获得这些结果(甚至更极端结果)的概率。 随后将该概率与预设的α值(Ⅰ类错误率)进行比较,以判断该效应是否可被视为“统计学显著”(尽管这种表述正逐渐被许多人弃用)。α值通常设定为0.05。
切勿误以为P值更小(例如<0.0001)的效果比P值为0.03的效果更强。P值的解读并非如此。相反,这仅仅表明您拥有更多的统计证据来拒绝“不存在效应”的零假设。 效应量反映了效应的强弱程度,而任何大小的效应(理论上)只要样本量足够大,都可能达到统计学显著性!
P值摘要
这是使用星号表示计算出的P值的常见符号形式。这些表示方式使您无需查看具体的数值,就能快速、轻松地了解每个给定P值的计算范围。星号的对应关系如下:
ns |
P > 0.05 |
* |
P ≤ 0.05 |
** |
P ≤ 0.01 |
*** |
P ≤ 0.001 |
**** |
P ≤ 0.0001 |
这是方差分析(ANOVA)的传统结果展示形式,提供了关于该分析的详细统计信息。虽然许多研究者可能更关注上文包含效应量和 P 值的表格,但方差分析表提供了计算这些信息所需的所有必要数值。继续以植物生长为例(一个包含双向交互作用的双因素方差分析),方差分析表可能如下所示:
方差分析表 |
SS(第三类) |
自由度 |
均方 |
F(n自由度, d自由度) |
P值 |
肥料 |
556.8178 |
2 |
278.4089 |
F (2, 54) = 82.90753 |
P<0.0001 |
浇水 |
494.3290 |
1 |
494.3290 |
F (1, 54) = 147.2065 |
P<0.0001 |
施肥:浇水 |
109.1686 |
2 |
54.8431 |
F (2, 54) = 16.25469 |
P<0.0001 |
残差 |
181.3355 |
54 |
3.358065 |
||
总计 |
1341.651 |
59 |
让我们逐一查看各部分
SS(第三类) - 平方和
定义:衡量归因于各来源的总变异量
计算方法:对于每个因子或交互作用,先拟合一个不包含该因子或交互作用的所有其他成分的模型,并计算残差平方和。然后拟合一个包含该因子或交互作用的所有成分的模型,并计算残差平方和。当包含该因子或交互作用时,残差平方和的减少量即报告为该因子或交互作用的第三类平方和。
第三类平方和:
•解释模型中所有其他效应
•每个效应的评估均假设其为最后引入的效应
•适用于不平衡设计
•大多数统计软件(包括 Prism)中的标准做法
注:由于四舍五入及第三类平方和的特性,各平方和的数值之和不会精确等于总平方和。
DF - 自由度
定义:用于估计每个效应的可用独立信息项的数量。
计算方法:
•因子自由度 = (水平数 - 1)
•交互作用自由度 = (因子1的自由度) × (因子2的自由度)
•残差自由度 = 总自由度 - (所有效应自由度的总和)
•总自由度 (Total DF) = (观测值总数 - 1)
自由度(DF)的重要性:
•决定 F 分布形状
•自由度越多 = 精度越高 = 检验力越强
•用于计算F比值和P值
MS - 平均平方
定义:给定效应下每自由度的平均变异量(SS)。
计算方法:SS / DF
解读:
•MS 越大 = 效应越大(按自由度计算)
•残差均方是“基准”方差(组内变异)
•若无效应,该因子的均方值应与残差均方值相近
•若存在效应,该因子的均方值应远大于残差均方值
•某个因子或交互作用的均方与残差均方的比值即为F比
F (DFn, DFd) - F 比值
定义:用于比较各效应方差与残差(误差)方差的检验统计量。
计算方法:F = 效应方差 / 残差方差
解读:
•F = 1 表示效应方差等于误差方差(无效应)
•F > 1 表示效应方差大于误差方差(可能存在效应)
•F >> 1 表示效应方差远大于误差方差(强效应)
P值
定义:若确实不存在效应(例如假设零假设成立),则获得如此之大(或更大)的 F 比值的概率。
如何确定:
•基于 F 比值和自由度
•F 比值越大 → P 值越小
•自由度越多 → P值估计越精确
残差
说明:数据中无法解释的变异(组内变异、随机误差)。
解读:
•这代表了数据中的“噪声”
•模型中的效应或交互作用无法解释的变异
•理想情况下,残差变异相对于解释变异量应较小(这会导致 F 统计量较大,即效应较大)
•残差均方(Residual MS)是所有F比值计算的分母
总
显示内容:所有观测值中数据的总变异量。
解读:
•这是数据在所有潜在组别、因子及交互作用中的变异
•这实质上是您的基准(在不考虑效应或组别的情况下,数据中存在多少变异)
•您的因子及其交互作用将这一总变异分解
•无法由因子解释的部分即为残差
在执行方差分析(ANOVA)并确定一个或多个效应或交互作用具有统计学显著性后,您可能希望进一步探究该效应下哪些具体组之间存在差异。多重比较功能正是为此而设计的。下文讨论的示例将采用 Tukey 的多重比较校正方法,但对于其他方法,结果的解释也基本相同。
本结果表的顶部区域列出了家族数(用于校正P值的比较族)、每个家族的比较次数,以及本组检验中指定的显著性水平(I类错误率)。
本部分包含指定多重比较的关键结果。下表展示了该部分可能呈现的样式。本示例表展示了“肥料”因子(包含“对照”、“有机”和“化学”三个水平)的主效应多重比较结果。
Tukey多重比较检验 |
均值差 |
差异的 95.00% 置信区间 |
低于阈值? |
摘要 |
|---|---|---|---|---|
对照组与有机组 |
-3.114238 |
-4.510795 至 -1.717681 |
是 |
**** |
对照组与化学处理组 |
-7.429723 |
-8.826280 至 -6.033166 |
是 |
**** |
有机 vs. 化学 |
-4.315485 |
-5.712042 至 -2.918928 |
是 |
**** |
对于每项比较,本表包含:
•被比较的水平名称
•被比较的两个水平的均值差
•均值差的95%置信区间
•一条总结性说明,指出调整后的P值是否小于指定的显著性水平
•(可选)校正后的P值(未显示在上表中)
•使用星号表示的P值符号摘要
若需进一步了解这些值的计算方法,测试详情表为每项比较提供了更多补充信息。
此表提供了针对每次比较计算的完整统计信息。以本示例为例,该表可能如下所示。
检验详情 |
均值 1 |
均值 2 |
均值差 |
差异标准误 |
N1 |
N2 |
q |
自由度 |
|---|---|---|---|---|---|---|---|---|
对照组 vs. 有机组 |
16.78325 |
19.89749 |
-3.114238 |
0.5794881 |
20 |
20 |
7.600152 |
54 |
对照组与化学处理组 |
16.78325 |
24.21297 |
-7.429723 |
0.5794881 |
20 |
20 |
18.13189 |
54 |
有机 vs. 化学 |
19.89749 |
24.21297 |
-4.315485 |
0.5794881 |
20 |
20 |
10.53174 |
54 |
这些结果大多直观易懂。“均值 1”和“均值 2”列分别表示指定比较中各组的均值,而“均值差”、“差值的标准误”、“N1”和“N2”(各组的样本量)以及自由度则提供了计算检验统计量并确定该比较 P 值所需的必要信息。