计算比例置信区间的方法有很多。您的目标是获得95%的置信区间,但实际上(对于所有方法而言),具体的置信水平依赖于分子和分母的精确数值。
Prism 提供了三种计算比例置信区间的方法:
•Clopper 和 Pearson 的所谓“精确法”(1)。这是 Prism 6(及更早版本)唯一采用的方法。无论输入何种数据,该方法都能确保实际置信水平高于您要求的水平(通常为 95%)。 但实际置信水平往往要高得多。因此,平均而言,这些置信区间的置信水平高于您要求的水平,因而比实际需要的更宽。
•威尔逊(Wilson)的方法(2)。对于某些数据,实际置信水平会高于用户设定的水平;对于另一些数据,实际置信水平则会低于设定的水平。平均而言,实际置信水平等于用户设定的置信水平。威尔逊的方法非常出色,但当概率值非常接近0或1时除外。请注意,虽然有些程序提供了带连续性修正的该方法变体,但Prism并未提供。
•混合威尔逊/布朗法(3)。在大多数情况下,该方法直接采用未作修改的威尔逊法。例外情况是当比例值非常接近0.00或1.00时。在这些情况下,布朗建议改用泊松近似法。 当分子(N)等于1或2时,以及当N=3且分母(D)超过50时,Prism在计算下限置信区间时采用该近似法。当N=D-1或N=D-2(或N=D-3且N>50)时,Prism在计算上限置信区间时采用该近似法。 请注意,当 N=0 时无需使用该近似方法。此时置信区间下限为 0.0,上限则通过威尔逊法计算。同样地,当 N=D 时,置信区间上限等于 1.00,下限通过威尔逊法计算。布朗及其同事 (3) 将这种混合方法称为改良威尔逊法,但该名称可能存在模糊拟合,因为此前已提出过其他对威尔逊法的改良方案。
我们推荐第三种(Wilson/Brown混合)方法。仅当您需要确保Prism的结果与另一程序的结果一致时,才使用前两种方法之一。
1.Clopper, C.; Pearson, E. S. (1934). "以二项分布为例说明置信区间或信赖限的应用". 《生物计量学》26: 404–413. doi:10.1093/biomet/26.4.404
2.Wilson, E. B. (1927). "概率推断、连续律与统计推断". 《美国统计协会杂志》 22: 209–212. JSTOR 2276774.
3.布朗,L.,蔡,T.,及达斯古普塔,A. (2001). 《二项分布比例的区间估计》。《统计科学》,16(2),101–133.