Prism 将“错误发现率(FDR)”的概念作为定义异常值的方法之一(无论是针对一组数值,还是在非线性回归过程中)。此外,Prism 还可在同时计算大量 t 检验时、分析在其他地方计算得到的一组 P 值时,以及作为单因素、双因素或三因素方差分析后的多重比较方法时使用 FDR 方法。
•该方法首先为每次比较计算一个 P 值。当作为方差分析(ANOVA)的后续步骤使用时,比较采用Fisher 最小显著差法(该方法本身虽不进行多重比较校正,但会合并方差以增加自由度)。当用于分析一组 t 检验时,每个 t 检验首先单独计算。分析一组 P 值时,当然需要直接输入这些 P 值。
•此处将阐述该方法的目标。第一步是指定 Q,即期望的错误发现率(可以是 0 到 1 之间的分数,或者等效地表示为 0% 到 100% 之间的百分比)。 随后,Prism 会告知您哪些 P 值足够低,可被视为“发现”,其目标是确保这些“发现”中实际为假阳性的比例不超过 Q%。例如,若 Q 设为 0.05,则目标是确保“发现”中假阳性的比例不超过 5%。
•Prism 允许您从三种算法中选择一种,以决定哪些 P 值足够小可被视为“发现”。Benjamini 和 Hochberg 方法最早开发,因此更为标准。Benjamani、Krieger 和 Yekutieli 方法具有更强的功效,因此更受青睐。Benjamini & Yekutieli 方法的假设较少,但功效也低得多。
•这种FDR方法在P值较小时不使用“统计学显著”这一概念或表述,而是使用“发现”一词。(部分作者采用不同的术语。)
•FDR方法无法为每次比较计算相应的置信区间。
•Q(注意是大写)是您输入的期望FDR值。Prism还会为每次比较计算q(小写)。该值q是使该特定比较恰好处于被归类为“发现”与否边界处的Q值。q值不仅依赖于该次比较,还依赖于比较族内的比较数量以及P值的分布。
•Prism 报告的 q 值是经过 FDR 调整的 p 值,而非经过 FDR 校正的 P 值。这是两者之间的一处微妙区别。
•若所有零假设均为真,则发现一项或多项发现的概率仅为 Q%(其中 Q 是您选择的错误发现率)。
•如果所有 P 值均小于您选定的 Q 值(需注意 P 值是分数而 Q 是百分比),则所有比较都将被标记为发现。(当您选择 Benjamini & Yekutieli 方法时,此规则不成立)。
•如果所有 P 值都大于您选定的 Q 值,则没有任何比较会被标记为发现。
•q值通常大于对应的P值。例外情况是:具有最大P值的比较,其q值可能等于该P值。
•q 值的计算取决于该比较的 P 值、其他 P 值以及比较的总数。您输入的 Q 值不会影响 q 的计算。
•Prism中的算法控制的是FDR,而非pFDR(此处不予赘述)。
•通过这些方法确定的q值往往高于(且绝不会低于)使用常规多重比较方法(如Bonferroni法等)计算出的校正P值。
•极佳的非数学性综述:Glickman, M. E., Rao, S. R., & Schultz, M. R. (2014). 《在健康研究中,错误发现率控制是博尼费罗尼型校正的推荐替代方案》。《临床流行病学杂志》,67(8),850–857。