以下指南是对如何呈现数据和分析结果的建议性指导。当然,您还需要报告实验设计的详细信息,包括盲法和随机化。
•每篇统计学论文都应完整地报告所有方法(包括用于处理和分析数据的方法),以确保他人能够完全复现该研究。
•每幅图和每张表都应清晰地呈现数据(且不应为了强调结论而进行夸大)。
•所有结果的报告都应足够完整,以至于无人会质疑您实际做了什么。
•您是否决定进行标准化?剔除异常值?转换为对数?平滑处理?去除基线?请说明这些决策的依据,并报告足够的细节,以便任何人都能基于您的数据获得完全相同的结果。说明这些计算是预先计划好的,还是仅在查看数据后才决定的。
•若剔除了异常值,请说明其数量、识别标准,以及这些标准是否作为实验设计的一部分预先选定。
•说明样本量的确定方法。
•在报告样本量时,请明确说明具体统计了什么。当您说 n=3 时,是指三只不同的动物、对同一只动物组织进行的三次不同检测、对三只动物混合组织进行的一次检测,还是指对一次实验制备物在伽马计数器中进行的三次重复计数……?
•说明您是预先确定样本量,还是随着结果的积累临时调整样本量。
•如果各组的样本量不相同,请说明原因。
•针对每项分析(通常对应每幅图和每张表),说明数据分析的每个步骤是否遵循了预先制定的方案。如果您是在查看数据后才决定剔除异常值,请说明这一点。如果您是在查看数据后才决定使用非参数检验,请说明这一点。如果您是在查看数据后才决定对数据进行对数分析,请说明这一点。
•若未展示所有进行的分析,至少应描述并列举这些分析。
•如果起始样本量与最终样本量不同,请详细说明您是如何决定增加或剔除样本的。说明这些决定是基于预设方案,还是在实验过程中做出的。
•清晰地呈现数据。重点在于让读者看到数据本身,而不仅仅是您的结论。
•在可能的情况下,绘制原始数据而非数据摘要。若散点图中数据值过多,可考虑使用盒须图或频率分布图。
•若选择绘制带误差条的均值,请绘制能体现变异性的标准偏差误差条,而非无法体现变异性的均值标准误差条。
•请写明检验的完整名称。不要只说“t检验”,而应说“配对t检验”。
•注明执行计算的软件程序(包括详细的版本号,例如 GraphPad Prism 可能是 7.01)。
•列出您选择的所有选项。是否采用重复测量?是否对方差不齐进行了校正?是否使用了稳健回归?是否对参数进行了约束?是否共享了参数?报告应包含足够细节,以便任何人都能基于您的数据获得与您完全相同的结果。
•大多数实验最重要的结果是效应量。差异(或比值或增长百分比)有多大?或者两个变量之间的相关性有多强?在绝大多数情况下,您可以用一个数值来概括这个效应量,并且应该报告该效应的置信区间,通常是95%置信区间。这是在论文及其摘要中报告的最重要发现。
•建议展示包含95%置信区间的效应量(即差异或比值)图表。
•在可能的情况下,应将P值以精确到几位小数的数值形式报告,而非不等式。例如,应写“P值为0.0234”,而非“P < 0.05”。
•如果存在任何可能的模糊拟合,请明确说明该 P 值所检验的零假设。如果您不知道零假设,那么就不应报告 P 值(因为每个 P 值都在检验一个零假设)!
•在比较两组数据时,应说明 P 值是单侧还是双侧(即单尾或双尾)。如果是单侧,应说明您在收集数据前已预测了效应的方向(并记录了该预测),且记录了该决策与预测。如果您在收集数据前未做出此决策和预测,则不应报告单侧 P 值。
•统计假设检验用于基于单一 P 值做出明确决策。其应用之一是在两个备选模型的拟合度之间进行选择。若 P 值小于预设阈值,则选择其中一个模型;否则选择另一个。进行此类操作时,需说明两个模型、用于在它们之间进行选择的方法、预设的阈值 P 值以及所选模型。或许还应报告两个模型的拟合优度。
• 在比较组别时,您并不总是根据结果做出决策。若需做出明确决策,请报告阈值P值、计算出的P值是否大于或小于该阈值,以及相应的决策结果。 若不进行决策,请报告效应及其置信区间,并可附上 P 值。若不基于该 P 值进行决策,那么 P 值是否小于阈值其实并不重要,统计假设检验的整个概念也就失去了实际意义。
•“显著”一词具有两种相关含义,因此在科学界引发了诸多混淆。上述两点说明,统计假设检验的结果可以(且我认为应当)在不使用“显著”一词的情况下进行报告。若您选择在此语境下使用“显著”一词,请务必在词前加上“统计学显著”以避免混淆。
•在讨论结果的临床或生理影响时,切勿使用“显著”一词。应改用“较大”、“相当大”和“具有临床意义”等词汇。在此语境下使用“显著”只会造成混淆。
•多重比较必须审慎处理,且所有步骤均需记录在案。请注意,多重比较问题普遍存在,而不仅仅是在方差分析(ANOVA)后的后续检验中才出现。
•需说明所有比较是否均在预先规划范围内,且所有计划内比较均已报告。若报告了未预先规划的比较或遗漏了某些比较,则必须将结果标注为初步结果。
•若采用了多重比较校正方法,请说明具体细节。
•若报告经多重性校正的 P 值,请明确指出这些 P 值已进行校正。
1.Curtis, M. J., Bond, R. A., Spina, D., Ahluwalia, A., Alexander, S. P. A., Giembycz, M. A., et al. (2015). 实验设计与分析及其报告:在《英国药理学杂志》上发表的新指南。《英国药理学杂志》,172(14),3461–3471。
2.Altman DG, Gore SM, Gardner MJ, Pocock SJ (1983). 医学期刊投稿者的统计指南。《英国医学杂志》286: 1489–1493.