在比较两组数据时,必须区分单尾P值和双尾P值。有些书籍称之为单侧和双侧P值,二者含义相同。
结合具体情境来理解这种区别最为直观。因此,让我们假设您正在比较两个组的均值(使用非配对t检验)。无论是单尾P值还是双尾P值,其依据都是同一个零假设:即两个总体确实相同,且样本均值之间的观察到的差异是由于偶然因素造成的。
双尾P值回答的是这个问题:
假设零假设成立,在随机抽取样本的情况下,其均值差异达到(或超过)本实验中观察到的程度,且任一组的平均值更大的概率是多少?
要解读单尾P值,您必须在收集任何数据之前预测哪个组的平均值会更大。单尾P值回答了这个问题:
假设零假设成立,随机抽取的样本均值相差至少与本实验中观察到的差异一样大(或更大),且指定组的平均值更大的概率是多少?
如果观察到的差异方向与实验假设的预测一致,则单尾P值等于双尾P值的一半(在大多数但并非所有统计检验中)。
当先前数据、物理限制或常识表明,若存在差异,该差异只能朝一个方向发展时,单尾检验是合适的。只有当以下两点同时成立时,才应选择单尾P值。
•您在收集任何数据之前就预测了哪个组的平均值(或比例)会更大。如果您是在看到数据后才做出“预测”的,那就别想使用单尾P值了。
•如果另一组的组平均值最终更大 - 即使大得多 - 您也会将这种差异归因于偶然,并称其“在统计学上不显著”。
以下是一个适合选择单尾P值的示例:您正在检验一种新抗生素是否会损害肾功能(以血清肌酐水平为指标)。许多抗生素会毒害肾细胞,导致肾小球滤过率降低和血清肌酐升高。 据我所知,目前尚无已知抗生素能降低血清肌酐水平,且很难想象存在某种机制能使抗生素提高肾小球滤过率。在收集任何数据之前,您可以指出两种可能性:要么该药物不会改变总体人群的平均血清肌酐水平,要么它会提高总体人群的平均血清肌酐水平。 您认为该药物真正降低人群平均血清肌酐水平的可能性为零,并计划将任何观察到的下降归因于随机抽样。因此,计算单尾P值是合理的。在本示例中,双尾P值用于检验“药物不改变肌酐水平”的零假设;单尾P值则用于检验“药物不增加肌酐水平”的零假设。
在选择单尾P值或双尾P值时,关键不在于您是否预期存在差异。如果您已经知道是否存在差异,就没有理由收集数据。真正的问题在于,差异的方向(如果存在的话)是否只能朝一个方向发展。 只有当您能(在收集任何数据之前)确信地断言总体中要么不存在差异,要么存在特定方向的差异时,才应使用单尾P值。 如果最终数据显示差异方向“错误”,您应当愿意将该差异归因于随机抽样,甚至无需考虑所测得的差异可能反映总体中真实差异的可能性。如果“错误”方向的差异会引起您的兴趣(哪怕只是一点点),您就应该计算双尾P值。
当您要求 Prism 报告单尾P值时,它会假设实际差异或效应的方向与您预测的方向一致,因此 Prism 报告的单尾P值总是小于(几乎总是正好为)双尾P值的一半。
如果实际上观察到的差异或效应与您的预测方向相反,Prism报告的单尾P值就是错误的。实际的单尾P值将等于1.0减去报告的那个值。例如,如果报告的单尾P值为0.04,而实际差异的方向与您预测的相反,那么实际的单尾P值就是0.96。
如果您在收集数据前未预测效应的方向,就不应报告单侧 P 值。说“嗯,我本会预测……”是自欺欺人。如果您未记录预测,就不应使用单侧 P 值。
单尾P值和双尾P值的概念仅适用于存在两种效应方向(增加或减少)的假设。若比较三个或更多组(方差分析 ANOVA),则单尾P值和双尾P值的概念便失去意义,且 Prism 软件也不会要求您进行此类选择。
如果实际效应与您的预测方向一致:
•单尾P值等于双尾P值的一半。
•双尾P值是单尾P值的两倍(假设您正确预测了差异的方向)。
此规则对几乎所有统计检验都完全适用。某些检验(如Fisher检验)不具有对称性,因此对于这些检验,上述规则仅为近似值。
如果实际效应的方向与您预测的方向相反:
•单尾P值等于1.0减去双尾P值的一半。