很多试验和临床试验的受试者人数过少。样本量较少的研究会白费力气,甚至无法检测到实质性治疗效果。即使治疗显著改变预后,研究依然会发现产生“统计学显著”效果的几率很小。
因此,在计划研究时,您需要选择合适的样本量。所需样本量取决于您对以下问题的回答:
在进行抽样的总体中,您希望抽样数据的分散程度如何?
如果使用统计学术语表述,即,总体中的方差程度如何。为确定样本量,必须估计总体中的方差(或标准差)。如果无法估计标准差,则无法计算出您需要多少例受试者。如果希望获得较大分散度(较大方差),则区分真实效应与随机噪声的难度将增大,因而将需要大量受试者。
该问题使用您对统计学显著性的定义进行回答。几乎所有研究者都选择5%显著性水平,这意味着小于0.05的P值视为具有“统计显著性”。如果选择较小显著性水平(例如,1%),则将需要更多受试者。
这一问题远比前两个问题棘手。每个人都倾向于计划一项能够检测到极小差异(小效应量)的研究,但需要较大样本量。在大部分时候,受资源(时间、金钱、可用参与者等)限制。您必须基于能够获得的资源,选择“有意义”的效应量。
您需要多确信您的研究能检测到差异(如有)?
换言之,您需要多少统计检验力?类似于上一项问题,每个人都想设计一项具有很大检验力的研究,因此如果治疗确实起作用,则肯定会得出“统计学显著”结果,但也需要很多受试者。
在Prism Cloud中,Prism检验力分析计算器不会要求您回答最后两个问题,而是在一张表格中显示结果,以便您查看样本量、检验力以及可以检测到的效应量之间的权衡。您可以观察这张表,在对试验的时间、费用和风险加以考虑的情况下,确定合适的样本量。请注意,该表并未直接回答“我需要多少受试者?”该问题,而是回答问题“如果我使用N名受试者,我将能够知道什么信息?”。Parker和Berman(1)建议使用这种样本量计算方法。
在某些情况下,这些结果可能会让您相信:基于您能够使用的受试者人数,并不能找到您想知道的信息。这可能非常有帮助。在计划阶段取消这种试验比浪费时间和金钱在无足够检验力的无效试验上要好得多。如果试验涉及任何临床风险或公共资金支出,则开展这类研究甚至会视为不合伦理。
较大样本量的优势之一在于,检测特定效应的检验力更大。同样,在同等检验力下,较大样本量有助于检测较小的效应量。但选择更大样本量(如有可能)还有另一项原因。在较大样本量的情况下,可以更好地评估数据分布。从高斯分布或对数正态分布抽样这一假设是否合理?样本越大,越容易评估
1. R. A. Parker和N. G. Berman,样本量:不只是计算,《美国统计学家》57:166-170,2003。