Please enable JavaScript to view this site.

Navigation: 统计学原理 > 样本量的选择

样本量计算中 α 和 β 的选择

Scroll Prev Top Next More

标准方法

在计算样本量时,许多科学家会采用标准值来设定α和β。他们通常将α设为0.05,β设为0.20(这相当于将功效设为80%)。

标准方法的优点在于,其他人也都是这么做的,而且无需费太多脑筋。缺点是,它并不总能很好地确定样本量

根据具体科研情境选择α和β

在计算样本量时,应根据实验设置以及犯第一类或第二类错误的后果来选择α和功效的数值()。

让我们考虑四个略显人为的例子。假设您正在进行一项筛选试验,旨在检测在您的系统中具有活性的化合物。在此背景下,Ⅰ类错误是指错误地认定一种药物有效,而实际上它并不有效;Ⅱ类错误是指错误地认定一种药物无效,而实际上它有效。但犯下Ⅰ类或Ⅱ类错误的后果取决于实验的具体情境。让我们考虑以下四种情况。

A. 从庞大的化合物库中筛选药物,且选择药物时没有生物学依据。您知道其中一些“阳性结果”将是假阳性(Ⅰ类错误),因此计划在另一项检测中对所有这些“阳性结果”进行复测。因此,Ⅰ类错误的后果是您需要对该化合物进行复测。 您不想重复测试过多的化合物,因此不能将α值设得过高。但将其设为一个相当高的数值(例如0.10)或许是合理的。当某药物实际上有效,而您却得出其无统计学显著效果的结论时,就会发生Ⅱ类错误。但在这种背景下,您还有数十万种药物待测,而您不可能全部测试。 通过选择较低的功效(例如60%),您可以使用较小的样本量。虽然您知道会漏掉一些真正有效的药物,但同样的投入可以测试更多药物。因此,在此情境下,将α值设为较高数值是合理的。总结:低功效,高α值。

B. 筛选基于科学逻辑选定的药物。Ⅰ类错误的后果与前文相同,因此将α值设为0.10是合理的。但在此情境下,Ⅱ类错误的后果更为严重。这些化合物是经过慎重筛选的,因此Ⅱ类错误意味着可能遗漏一款优秀的药物。在此情境下,应将功效设为较高值。总结:高效能,高α值。

C. 测试经过精心筛选的药物,且没有进行第二轮测试的机会。 假设这些化合物可能不稳定,因此只能在一次实验中使用。该实验的结果 - 即命中与未中名单 - 将用于建立结构活性关系,进而据此制定新的化合物清单供化学家合成。这是一项耗资巨大且耗时费力的任务,因此此次实验承担着重大责任,且难以重复。 在此情况下,Ⅰ类和Ⅱ类错误的后果都相当严重,因此您将α设为较小值(例如0.01),并将功效设为较大值(例如99%)。选择这些参数意味着您需要更大的样本量,但在此情境下,这笔投入是值得的。总结:高功效,低α值。

D. 重新审视情景C。情景C所需的样本量可能过高而难以实现。您根本无法进行如此多的重复实验。与同事商议后,您认为犯I类错误(错误地认为药物有效)的后果远比犯II类错误(漏检真实有效的药物)严重得多。 一次误判可能会对您的结构活性关系研究产生巨大影响,并导致化学家合成错误的化合物。而错误地判定一种药物无效,其后果则相对较轻。因此,您选择较低的α值,同时也接受较低的功效。总结:低功效,低α值。

核心要点

这些情景是人为设定的,当然,唯一有权决定如何设计药物筛选方案的,是进行筛选的研究人员。但这些情景说明了一个道理:在选择α值和功效时,必须仔细权衡犯第一类和第二类错误的后果。这些后果取决于您实验的科学背景。仅仅使用标准的α值和功效值,其实并没有多大意义。