Please enable JavaScript to view this site.

四个问题

许多实验和临床试验的受试者数量都太少。统计功效不足的研究是徒劳的,因为即使治疗效果显著,也很可能无法被检测出来。即使治疗确实显著改变了结果,该研究发现“统计学显著”效果的概率也很小。

因此,在规划研究时,您需要选择合适的样本量。所需的样本量取决于您对以下问题的回答:

您预计在所抽样的总体中,数据分布会有多分散?

从统计学角度而言,这相当于询问总体中存在多少方差。为了确定样本量,您必须估算总体的方差(或标准偏差)。如果无法估算标准偏差,就无法计算所需的受试者数量。如果您预计数据分布较为分散(即方差较大),那么就更难区分真实效应与随机噪声,因此需要大量受试者。

您愿意承担多大风险,以防因偶然因素而错误地发现差异?

这个问题取决于您对统计显著性的定义。几乎所有研究者都选择5%的显著性水平,这意味着P值小于0.05被视为“统计学显著”。如果您选择更低的显著性水平(例如1%),那么您需要更多的受试者。

您希望检测多大的差异?

这个问题比前两个要棘手得多。虽然大家都希望设计出能检测到极微小差异(小效应量)的研究,但这需要庞大的样本量。大多数情况下,您会受到资源(时间、资金、可用受试者等)的限制。您必须选择一个既“有意义”又在现有资源条件下可行的效应量。

如果您确信存在差异,您需要多大程度的把握才能通过研究检测到它?

换言之,您需要多大的功效?与前一个问题类似,大家都希望设计出功效很高的研究,这样如果干预措施确实有效,就能相当确定地得出“统计学显著”的结果,但这同样需要大量受试者。

样本量计算的替代方法

Prism Cloud 中的 Prism 功效分析计算器不会要求您回答前两个问题,而是通过表格呈现结果,让您直观了解样本量、功效以及可检测效应量之间的权衡关系。您可以参考该表格,综合考虑实验所需的时间、费用和风险,从而确定合适的样本量。 请注意,该表格并非直接回答“我需要多少受试者?”,而是回答相关问题:“如果使用 N 名受试者,我能获得哪些信息?”。这种样本量计算方法由 Parker 和 Berman (1) 推荐。

在某些情况下,这些结果可能会让您意识到,仅凭可用的受试者数量,根本无法获得您想要了解的信息。这其实非常有帮助。在规划阶段就取消此类实验,远比在缺乏足够功效的徒劳实验上浪费时间和金钱要好得多。如果实验涉及任何临床风险或公共资金支出,进行此类研究甚至可能被视为不道德。

此外……

样本量更大的一个好处是,您拥有更强的功效来检测特定效应。等效地,在功效恒定的情况下,更大的样本量将使您能够检测到更小的效应量。但在可能的情况下选择更大样本量还有另一个原因。随着样本量的增大,您可以更好地评估数据的分布。假设数据来自高斯分布或对数正态分布是否合理?样本量越大,评估起来就越容易

参考文献

1. R. A. Parker 和 N. G. Berman,《样本量:不仅仅是计算》,《美国统计学家》57:166-170,2003。