如果您绘制带有误差条的图表,或制作包含正负值的表格,就需要决定是显示标准差(SD)、标准误(SEM),还是其他指标。
通常,比起用均值搭配标准差(SD)或标准误(SEM)绘制图表,还有更好的替代方案。
如果每个数值代表不同的个体,您很可能希望展示数值之间的变异性。即使每个数值代表不同的实验室实验,展示这种变异性通常也是有意义的。
若绘制柱状图时,每个数据集的值少于 100 个左右,请制作一个散点图来展示所有数据。还有什么比展示所有数据更能体现数据间变异性的方法呢?如果数据集包含 100 个以上的值,散点图会显得杂乱无章。替代方案包括盒须图、频率分布(直方图)或累积频率分布。
若绘制XY数据(尤其是涉及多个处理组时),绘制每个重复样本会导致图表杂乱。这虽是全面了解数据的良好第一步,但在正式展示数据时,应改用均值和误差条。
若需绘制均值与误差条,标准差(SD)可量化重复样本间的变异性。中位数搭配四分位距或全范围的图表同样能体现这一信息。绘制带误差条的图表时,务必在图中或图例中说明误差条的计算方法。
若您的目标是通过t检验或方差分析(ANOVA)比较均值,或展示数据与模型预测值的吻合程度,您可能更关注数据对均值的精确界定,而非单纯展示变异性。此时,最佳做法是绘制均值的95%置信区间(或90%及99%置信区间)。
那么均值的标准误差(SEM)呢?用SEM误差条绘制均值是展示您对均值了解程度的常用方法。SEM误差条的唯一优势在于它们较短,但相比置信区间,SEM误差条更难解读。尽管如此,SEM误差条在许多领域仍是标准做法。
无论您选择展示哪种误差条,务必说明您的选择。观察误差条是否重叠所提供的信息,可能不如您想象的那么有意义。
若您的目的是强调数据中微小且不重要的差异,请将误差条显示为标准误(SEM),并希望读者误以为那是标准差(SD)
如果我们的目标是掩盖显著差异,就将误差条显示为各组的标准偏差,并希望读者误以为它们是标准误差。
这种做法是由史蒂夫·西蒙(Steve Simon)在其出色的博客中提倡的。当然,他只是开个玩笑。如果您不明白这个玩笑,请复习一下标准差(SD)和样本误差(SEM)之间的区别。