Please enable JavaScript to view this site.

此选项卡上的选项会根据您在第一个选项卡中选择的测试而略有不同。

计算

对于大多数用户而言,计算选项的默认设置已足够(双尾P值、95%置信区间,以及将第一列减去第二列来计算差异)。

单尾P值或双尾P值。除非有充分理由不这样做,否则请选择双尾P值。

以何种方式报告差异。此选项决定 Prism 报告均值或中位数之间差异的正负符号。您希望用第二个均值减去第一个,还是用第一个均值减去第二个?

置信水平。95%是标准值,但您可以选择其他置信水平。

绘图选项

本节中的可用选项依赖于您在第一个选项卡中选择的检验类型。这些选项有助于更深入地查看数据,但对初学者而言并非必需,唯一可能的例外是“估计图”。

绘制差异(配对)或绘制对数(比率)。 配对t检验和 Wilcoxon配对检验首先计算每一行中两个值之间的差值。此选项将生成一个表格和图表,展示这些差值的列表。在进行比率t检验时,此选项允许生成成对值比率对数(log(ratios))的图表(请注意,两个值的比率对数在数学上等同于这两个值对数的差值)。

绘制秩(非参数)。Mann-Whitney检验首先将所有值按从小到大的顺序排序,然后比较两组的平均秩。此选项将生成一个表格和图表,展示这些秩。Wilcoxon检验首先计算每对值之间的差值,然后对这些差值的绝对值进行排序,当差值为负时赋予负值。

相关性图(配对)。若假设正态分布,该图将绘制一组数据与另一组数据的对比,以直观评估两组数据的相关程度。若假设对数正态分布,则绘制各组数据对数的对比。

绘制均值差的置信区间(估计图)。此选项生成包含原始数据散点图(或小提琴图)的图形。此外,该图形还包含第三组数据集,用于绘制均值差及其 95% 置信区间(针对非配对检验),或差值的均值及其 95% 置信区间(针对配对检验)。 估计图对于直观评估 t 检验结果非常有用。阅读更多关于如何理解和使用估计图的内容。请注意,如果假设对数正态分布,这些选项会略有不同。

o对于采用对数正态分布的非配对设计,将生成一个估计图,绘制各组值的对数及其平均值(对该平均值取指数可得各组的几何均值)。 此外还提供第三组图,绘制各组平均值对数之间的差值及其 95% 置信区间。对该值取指数可得两组几何均值的比值。

o对于对称设计且服从对数正态分布的情况,该图仅显示配对比值的几何均值及其95%置信区间

附加结果

这些选项默认未被选中。AIC 选项仅用于特殊目的。其他选项即使对初学者也可能有用。

描述性统计。选中此选项后,Prism 将为每个数据集生成新的描述性统计表。

还可使用 AICc 比较模型。由于该方法非标准做法,多数用户通常不会选用。 非配对t检验本质上是比较两个模型对数据的拟合程度(一个共享均值与两个独立组平均值的对比)。t检验的计算等同于额外平方和F检验。勾选此选项后,Prism 将报告常规的 t检验结果,同时还会通过 AICc 比较两个模型的拟合度,并报告每个模型正确的概率百分比。

非参数检验。计算中位数之差(Mann-Whitney检验)或配对差值的中位数(Wilcoxon检验)的95%置信区间。 只有在做出解读 P 值时不需要的额外假设时,才能解读该置信区间。对于Mann-Whitney检验,必须假设两个总体具有相同的分布形状(无论其具体形式如何)。对于Wilcoxon顿检验,必须假设差值的分布是对称的。统计分析若附带置信区间报告无疑更为实用,因此值得考虑是否愿意接受这些假设。计算细节。

Wilcoxon顿检验。当行内两个配对值相同时会发生什么?Prism 5 按照Wilcoxon顿在创建该检验时所描述的方式处理此情况。Prism 提供了改用普拉特(Pratt)方法的选项。如果您的数据中存在大量并列值,建议您阅读关于这两种方法的说明并决定采用哪一种。

报告效应量(Cohen's d、Hedges' g、Glass's Δ)。勾选此选项可计算标准化效应量,用于量化组间差异的大小。

t检验的效应量

本节所述的功能仅在 Prism Pro 或 Prism Enterprise 版本中提供。

在用 t 检验比较两组数据时,P 值能告诉您差异是否统计学显著,但无法说明该差异的大小或实际意义。效应量提供了衡量组间差异幅度的标准化指标,有助于更轻松地解读结果的实际意义,并比较不同研究间的发现。Prism 为 t 检验计算了多种互补的效应量指标。

R²(eta²)

R²(在 t 检验中也称为 η²)代表因组别归属而解释的因变量方差比例。其取值范围为 0 到 1,其中 0 表示组别归属未解释任何方差,1 表示解释了全部方差。 例如,R²值为0.14意味着,仅凭数据值所属的组别即可解释数据中14%的变异,而剩余的86%变异源于组内个体差异。该指标与t统计量直接相关,其信息与方差分析(ANOVA)中的η²(η²)完全一致。

Cohen's d

Cohen's d 用标准偏差单位表示组平均值之间的差异。其计算方法是将均值之差除以合并标准偏差。Cohen 提出了以下解读指南:

小效应:d ≈ 0.20

中等效应:d ≈ 0.50

大效应:d ≈ 0.80

例如,Cohen's d 为 0.73 意味着两个组平均值相差 0.73 个标准偏差。这属于中等偏大的效应,表明其不仅具有统计学显著性,更具有实质性的实践意义。

赫吉斯 g

赫吉斯 g 是科恩 d 的变体,用于校正小样本量带来的偏差。在大样本中,这种校正作用微乎其微,但在样本量较小(每组少于 20 人)时则变得尤为重要。由于赫吉斯 g 能提供更准确的估计值(特别是在小样本中),因此在发表论文时通常更倾向于使用它而非科恩 d。其解释准则与科恩 d 相同。

格拉斯Δ(delta)

格拉斯的Δ(delta)与科恩的d类似,但仅使用对照组的标准偏差作为分母,而非合并两组数据。这在以下情况下特别有用:

两组变异性差异极大

将实验组与已确立的对照组进行比较

干预措施可能同时影响变异性与均值

格拉斯δ的解读准则与科恩d相同。

效应量的选择与解读

对于大多数应用,我们建议报告赫奇斯g值,因为它提供了最精确的估计,特别是在样本量小的情况下。然而,这三种标准化效应量(d、g和Δ)在描述效应大小方面传递的信息相似,且均采用相同的解读准则。

在以下情况下,效应量尤为重要:

您发现统计学显著差异,但想知道其是否具有实际意义

您正在比较采用不同测量量表的各项研究结果

您正在规划未来研究,并需要估算检测特定效应量所需的样本量

您正在进行整合多项研究结果的元分析

请记住,即使效应量很大,也不一定意味着该差异在您的具体情境下具有重要性;而效应量虽小,仍可能具有科学或临床意义。解读效应量时,务必结合您的研究问题和研究领域。