非配对t检验用于比较两个组的平均值。请注意,该检验通常被称为独立样本t检验。
最有用的结果是均值差的置信区间。实验的目的是了解两个均值相差多远。置信区间则告诉您对这一差值的估计有多精确。如果分析的假设成立,您可以有95%的置信度认为95%置信区间包含两个均值之间的真实差值。
对于许多用途而言,这个置信区间已足够满足需求。请注意,您可以在 t 检验对话框的“选项”标签页中更改差异的符号,在那里您可以指示 Prism 将 B 列减去 A 列,或将 A 列减去 B 列。
Prism 还会报告两个均值之间的差异及其标准误差。
P 值
P 值用于判断两个组平均值之间的差异是否可能由偶然因素造成。它回答了以下问题:
传统上,人们常利用 P 值来简单判断差异是否“统计学显著”,但这种做法并非必要,且往往并不实用。
根据P值的大小不同,您对结果的解读也会有所不同。
t 比值
为了计算非配对t检验的P值,Prism首先计算t比值。t比值是样本均值之差除以该差值的标准误差,后者通过合并两组的标准误差(SEM)计算得出。如果该差值相对于其标准误差较大,则t比值将较大(或为较大的负数),此时P值较小。 t 比值的正负仅表明哪个组的平均值更大。P 值则由 t 值的绝对值推导而来。Prism 报告 t 比值是为了便于您与其他程序或教科书中的示例进行比较。在大多数情况下,您应重点关注置信区间和 P 值,可以安全地忽略 t 比值的数值。
对于非配对t检验,自由度 (df) 等于总样本量减去 2。Welch t 检验(一种不假设方差相等的 t 检验变体)通过一个复杂的方程计算自由度。
非配对t检验依赖于以下假设:两个样本来自具有相同标准偏差(因此方差也相同)的总体。Prism使用F检验来检验这一假设。
首先计算两组的标准偏差,并将它们平方以获得方差。F 比值等于较大方差除以较小方差。因此 F 值总是大于(或可能等于)1.0。
P 值所探讨的问题是:
如果两个总体方差确实相等,那么获得如此大或更大的 F 比值的概率是多少?
请勿将用于检验组间标准偏差是否相等的 P 值,与用于检验均值是否相等的 P 值混淆。后者才是您在选择 t 检验时最可能想了解的 P 值。
与大多数统计软件不同,Prism会在非配对t检验结果中报告R²值。该值量化了样本中所有变异中由组平均值差异所解释的比例。若R²=0.36,则意味着所有数值间变异的36%归因于两组平均值的差异,剩余64%的变异则源于组内数值间的离散。
如果两个组的平均值相同,那么数据值之间的变异就完全不会归因于组平均值的差异,因此 R² 将等于零。如果组平均值之间的差异相对于组内数据值的离散程度而言非常大,那么数据值之间的变异几乎全部归因于组间差异,此时 R² 将接近 1.0。