生存分析是研究从开始到特定目标事件发生之间所经过时间的过程。在许多实验中(尤其是生物科学领域的实验),目标事件通常是指受试者的死亡(如小鼠、细胞等)。 此类实验的因变量是受试者存活的时间长度(这也正是该分析名称的由来)。然而,生存分析同样适用于其他关注事件发生时间数据的实验,例如测量机械部件使用至损坏或失效所需的时间,或是测量学生获得学位所需的时间。 在这些情况下,分析可能有不同的名称(在经济学中,这些分析可能被称为“持续时间分析”或“持续时间建模”;在社会学中,这些研究可能被称为“事件史分析”)。然而,所有这些分析在本质上都是相同的。
生存分析的主要成果之一,是理解生存概率随时间的变化规律。 这种关系可以通过生存曲线的形式直观呈现。这些曲线针对特定总体生成,其中X轴表示经过时间,Y轴表示生存概率(以分数或百分比形式表示)。因此,曲线的位置定义为:相关总体中某个体在给定时间内“生存”且未经历目标事件的概率。请看下图所示的生存曲线示例:

在此图中,我们可以观察到生存曲线典型的“阶梯状”斜率。图中生存概率以百分比形式呈现,在时间零点为100%,并在约83天时降至0%。 这种“阶梯状”形态源于生存概率的计算方式:生存概率仅在某位个体经历目标事件时发生变化(当目标事件为死亡时,即为个体死亡的时间点),因此每个垂直下降点都代表研究群体中发生的一起事件。 这些图表可用于确定单一人群的重要信息(如中位生存时间),或对各自拥有对应生存曲线的多个群体进行统计比较。
上图是使用 Kaplan-Meier 方法绘制的,本指南的这一部分将介绍如何在 Prism 中进行 Kaplan-Meier 生存分析。