GraphPad Prism 11 Statistics Guide - 样本量确定概览

Zoom Window Out
Larger Text | Smaller Text
Hide Page Header
Show Expanding Text
Printable Version
Save Permalink URL

样本量确定概览

四个问题

许多实验和临床试验的受试者数量都太少。统计功效不足的研究是徒劳的，因为即使治疗效果显著，也很可能无法被检测出来。即使治疗确实显著改变了结果，该研究发现“统计学显著”效果的概率也很小。

因此，在规划研究时，您需要选择合适的样本量。所需的样本量取决于您对以下问题的回答：

您预计在所抽样的总体中，数据分布会有多分散？

从统计学角度而言，这相当于询问总体中存在多少方差。为了确定样本量，您必须估算总体的方差（或标准偏差）。如果无法估算标准偏差，就无法计算所需的受试者数量。如果您预计数据分布较为分散（即方差较大），那么就更难区分真实效应与随机噪声，因此需要大量受试者。

您愿意承担多大风险，以防因偶然因素而错误地发现差异？

这个问题取决于您对统计显著性的定义。几乎所有研究者都选择5%的显著性水平，这意味着P值小于0.05被视为“统计学显著”。如果您选择更低的显著性水平（例如1%），那么您需要更多的受试者。

您希望检测多大的差异？

这个问题比前两个要棘手得多。虽然大家都希望设计出能检测到极微小差异（小效应量）的研究，但这需要庞大的样本量。大多数情况下，您会受到资源（时间、资金、可用受试者等）的限制。您必须选择一个既“有意义”又在现有资源条件下可行的效应量。

如果您确信存在差异，您需要多大程度的把握才能通过研究检测到它？

换言之，您需要多大的功效？与前一个问题类似，大家都希望设计出功效很高的研究，这样如果干预措施确实有效，就能相当确定地得出“统计学显著”的结果，但这同样需要大量受试者。

样本量计算的替代方法

Prism Cloud 中的 Prism 功效分析计算器不会要求您回答前两个问题，而是通过表格呈现结果，让您直观了解样本量、功效以及可检测效应量之间的权衡关系。您可以参考该表格，综合考虑实验所需的时间、费用和风险，从而确定合适的样本量。请注意，该表格并非直接回答“我需要多少受试者？”，而是回答相关问题：“如果使用 N 名受试者，我能获得哪些信息？”。这种样本量计算方法由 Parker 和 Berman (1) 推荐。

在某些情况下，这些结果可能会让您意识到，仅凭可用的受试者数量，根本无法获得您想要了解的信息。这其实非常有帮助。在规划阶段就取消此类实验，远比在缺乏足够功效的徒劳实验上浪费时间和金钱要好得多。如果实验涉及任何临床风险或公共资金支出，进行此类研究甚至可能被视为不道德。

此外……

样本量更大的一个好处是，您拥有更强的功效来检测特定效应。等效地，在功效恒定的情况下，更大的样本量将使您能够检测到更小的效应量。但在可能的情况下选择更大样本量还有另一个原因。随着样本量的增大，您可以更好地评估数据的分布。假设数据来自高斯分布或对数正态分布是否合理？样本量越大，评估起来就越容易

参考文献

1. R. A. Parker 和 N. G. Berman，《样本量：不仅仅是计算》，《美国统计学家》57:166-170，2003。