为了确认简单逻辑回归是否适合用于分析这些数据,请自问以下问题:
因变量(Y)是否为二分类变量?自变量(Y)只能取两个值,在Prism中,这些值必须编码为0和1。
观测值(行)是否相互独立?逻辑回归的基本假设之一是,数据的每一行都代表一个独特且独立的观察结果。独立观察结果的示例包括:一项针对100名随机选取人员的调查,其中1表示阳性结果,0表示阴性结果,且每名受试者仅记录在一行中。如果对每名受试者进行了多次测量(例如在研究的各个时间点),则观察结果不具有独立性,逻辑回归不适用。 如果部分参与者来自同一家庭,独立性也会受到质疑,因为来自同一家庭的两个人之间的结果往往比两个互不相关的人之间的结果更相似。
该模型是否能很好地拟合并预测数据?所有模型都有误,但有些是有用的……
Prism 提供了多种指标来评估简单的逻辑模型与输入数据的拟合程度。但需注意,模型拟合及对拟合结果的解读在某种程度上具有主观性。评估特定模型时可考虑以下几点:
•该模型能否有效分类数据?换言之,模型能否正确预测观测到的 0 和 1?您可以在 Prism 中通过多种方式评估这一点,例如使用 Tjur 的 R 平方、ROC 曲线(含 ROC 曲线下面积)以及行分类表。
•逻辑模型是否优于仅含截距模型的模型?Prism通过两种相关但略有不同的方法检验这一概念:使用Wald检验检查β1是否显著不为零,以及使用似然比检验直接比较给定模型与仅截距模型。
您是否有足够的数据来确保结果的可靠性?与所有统计建模一样,数据越多(通常)越好。在分析结果的表格底部,Prism会报告模型中包含的观测值数量(“已分析行”)。对于简单的逻辑回归,一般经验法则是至少要有10个结果为0的观测值和10个结果为1的观测值。
是否存在模型欠拟合?在简单逻辑回归中,您的预测因子(X)可能只是影响结果成败的多个变量之一。如果模型的预测性能未达预期,可能是您遗漏了某些关键变量 - 这些变量要么未被测量,要么被您选择不纳入模型。 如果您只是选择不将它们纳入模型,您绝对应该使用多元逻辑回归来探究它们的影响 - 这是简单逻辑回归的自然延伸。点击此处阅读更多关于多元逻辑回归的内容。另一方面,如果关键变量是您未测量的,那您就没辙了。请回去重新进行实验,重点收集更多信息。之后再回来进行多元逻辑回归!