二项式检验是一种精确检验,用于在仅有两个类别(即仅输入了两行数据)时,将观测分布与预期分布进行比较。在此情况下,卡方检验仅为近似方法,因此我们建议改用精确的二项式检验。
示例
假设您的理论认为某事件发生的概率应为20%。实际上,在一项包含100次重复的实验中,该事件仅发生了7次。您原本预期该事件会发生20次(100次的20%),但实际只发生了7次。这种巧合有多罕见?二项式检验正是为解答这一问题而设计的。
创建一个“整体与部分”表格,在第1行输入7,第2行输入93,并可根据需要标注行标题。点击“分析”,在“整体与部分”部分中选择“比较观测分布与期望值”。输入期望值(20和80),并选择二项式检验(而非卡方检验)
Prism 会同时报告单尾P值和双尾P值。
单尾P值(也称为单侧P值)的含义很直观。零假设是:预期结果源于正确的理论。因此,P值回答了以下问题:
如果真实比例为 20%,那么在 100 次试验中,观察到 7 次或更少事件的概率是多少?
必须包含“或更少”这一条件,因为如果 100 次试验中事件的数量少于 7 次,那将更为令人惊讶。
本示例的单尾P值为:0.0003。
如果观察值小于期望值,Prism 会报告单尾P值,即观察到该数量或更少事件的概率。如果观察值大于期望值,Prism 会报告单尾P值,即观察到该数量或更多事件的概率。
双尾P值的定义稍显复杂。实际上,至少有三种定义方式。
Prism采用下文中的第三种定义,这也是Prism在生成摘要(* 或 **...)时所使用的P值。
•将单尾P值乘以 2。0.0002769 的两倍等于 0.0005540。这看似合理,但该方法并未被采用。除非预期比例为 50%,否则二项分布的不对称性使得简单地将单尾P值乘以 2 并不明智。
•距离预期值等距。理论上预期发生 20 次事件。我们观察到 7 次。偏差为 13(20-7)。因此,分布的另一端应为获得 20+13=33 次或更多事件的概率。 按此方法计算的双尾P值,等于获得7次或更少事件的概率(0.0002769;与单尾P值相同)加上获得33次或更多事件的概率(0.001550441),这意味着双尾P值等于0.00182743。
•小P值法。采用此法定义第二尾时,我们不以相同距离向外延伸,而是从一个同样不太可能的值开始定义第二尾。当真实概率为0.20时,观察到100次事件中恰好有7次发生的概率为0.000199023。 获得33个事件(即另一种方法中定义的第二尾)的概率更高:0.000813557。获得34个事件的概率也更高。但观察到35个事件的概率则略低(0.000188947)。 因此,第二尾被定义为观察到35次或更多事件的概率。该尾部概率为0.0033609。因此,双尾P值为0.00061307。这是Prism采用的方法。
第二种方法与第三种方法之间的区别很微妙。第一尾的定义明确:它从7开始,一直延伸到0。第二尾是对称的,但有两种定义方式。 第二种方法是以计数为对称轴。换言之,该尾部的边界(33)距离期望值20的距离,与观察值7距离期望值20的距离相等(33-20=20-7)。第三种方法是以概率为对称轴。 假设真实概率为20%,因此我们预期观察到20次,观察到7次事件的概率与观察到35次事件的概率大致相同。因此,第二尾是指观察到35次或更多事件的概率。
若期望概率为 0.5,二项分布呈对称分布,三种方法均得出相同结果。当期望概率为 0.5 时,二项式检验与符号检验结果一致。