Please enable JavaScript to view this site.

Navigation: 使用 PRISM 进行统计分析 11 > 生存分析

从多变量数据表执行 Kaplan-Meier 生存分析

Scroll Prev Top Next More

本页面所述的功能均包含在我们的全新 Pro 和 Enterprise 订阅中。了解更多...

Prism 的 Kaplan-Meier 生存分析现可直接处理多变量数据表。这意味着您可以将生存数据保留在多数统计软件和临床试验数据库所采用的标准数据库格式中,而无需将其重新格式化为 Prism 传统的生存分析表格格式。

生存分析本身完全一致:它采用相同的计算方法,生成相同的图表,并执行相同的对数秩检验。唯一的区别在于您如何组织数据,以及如何告知 Prism 哪些变量包含时间值、事件指标和分组信息。

有何新功能

当您从“多变量”表格运行生存分析时,会在分析参数对话框中看到一个新的“数据”选项卡。您可以在此为变量分配角色:

状态(删剪)变量用于告知 Prism 每个受试者是否经历了您正在追踪的事件,或是被删剪

时间变量:时间值(天、周、月等)

分组变量:用于生成多个独立生存曲线并比较组间生存曲线的可选分类变量

其余所有内容 - 包括“方法”选项卡、“输出”选项卡、生存曲线以及对数秩检验 - 其操作方式与传统生存分析表完全一致。

何时使用多变量表进行生存分析

多变量表格特别适用于生存数据,因为临床和实验数据库几乎总是以长格式存储此类数据(每行一个受试者,列包含生存时间、事件状态和分组因素)。如果您的数据已采用此格式,则无需重新组织即可直接导入 Prism。

在以下情况下建议使用多变量格式:

从临床试验数据库或其他数据管理系统导入数据时

您的数据包含多个需要探索的分组因素(如治疗方案、分期、年龄组等)

您希望针对同一数据集,使用不同的分组变量运行多种不同的生存分析

您处理的数据已采用标准的“tidy”格式

您需要对同一数据集进行其他分析(如Cox回归、其他统计检验)

对于仅需比较两三个组并直接在Prism中输入数据的简单生存分析,传统的表格格式依然非常适用。

生存数据的结构

生存分析需要每个受试者的三项关键信息:

1.时间值:该受试者的随访时长是多少?(天、月、年等)

2.事件状态:目标事件是否发生,还是该观测值被删剪?

3.分组归属(可选):该受试者属于哪个治疗组、风险类别或其他分组?

在多变量表中,每一行代表一名受试者,各列包含上述不同信息。

基本生存数据布局

以下是一个典型的生存数据集结构:

PatientID

生存天数

事件

治疗

001

245

1

对照组

002

189

1

控制

003

365

0

控制

004

412

1

药物_A

005

523

1

药物_A

006

365

0

药物_A

...

...

...

...





在本示例中,患者003和患者006被视为删剪(事件 = 0)。这意味着在随访结束时(即第365天),他们仍然存活,或者可能是在第365天接受观察后退出了研究。其余患者在所示时间点发生了事件(事件 = 1)。

运行分析时,需分配:

状态(删剪)变量:Event(删剪指示变量)

时间变量:Survival_Days(时间值)

分组变量:Treatment(用于比较组间生存曲线)

处理多个状态变量

使用“多变量”表格的一个强大功能是能够分析同一数据集中的多个结果。例如,您可能拥有表示不同类型事件的变量 - 死亡、疾病进展、治疗中止 - 并且希望为每个结果分别绘制生存曲线。

您可以在单次分析中分配多个状态变量(事件指示变量)。Prism 将为每个响应变量生成独立的生存曲线。若同时分配分组变量,您将获得响应变量与分组之间所有组合的生存曲线。

多结局示例:

患者ID

随访天数

死亡

疾病进展

治疗

001

245

1

1

对照组

002

365

0

1

控制

003

523

1

1

药物_A

...

...

...

...

...

若将“死亡”和“疾病进展”均设为状态变量,并将“治疗”设为分组变量,Prism 将生成四条生存曲线:

死亡 - 对照组

死亡 - 药物_A

疾病进展 - 对照组

疾病进展 - 药物A

这使您能够通过单一分析设置轻松探索不同的终点。

使用多个分组变量

临床试验和观察性研究通常涉及多个您可能希望用于分层的因素 - 治疗组、疾病分期、年龄组、体能状态等。借助“多变量”表格,您可以指定多个分组变量,Prism 将为每种独特的组合生成生存曲线。

包含多个分组因子的示例:

患者ID

生存天数

事件

治疗

分期

001

245

1

对照组

早期

002

189

1

控制

高级

003

412

1

药物_A

早期

...

...

...

...

...

将“治疗”和“分期”都设为分组变量将生成四条生存曲线:

对照-早期

对照组-晚期

药物A-早期

药物_A-晚期

这样可以轻松观察治疗效果是否随疾病分期而异。

请注意,分组变量越多,生存曲线和统计比较就越多。若包含 2 种治疗方案、2 个疾病阶段和 2 个年龄组,则将产生 8 条生存曲线。请确保每种组合中都有足够的事件,以获得有意义的结果。

状态变量:删剪指标

生存分析中的状态变量即为删剪指标。该列用于告知Prism每个受试者是发生了事件还是被删剪。Prism需要知道您使用的编码规则:

1 = 发生事件,0 = 删剪(最常见的约定)

0 = 发生事件,1 = 删剪(有时用于较旧的数据集)

您需在分析参数对话框的“方法”选项卡中指定所采用的约定,这与传统生存分析表的操作方式相同。Prism 随后将正确解读您的数据。

您还可以在此处指定一个分类变量。在这种情况下,您可以选择所选分类变量的哪个水平对应于删剪观测值,哪个水平对应于事件。这可以简单地将“删剪”和“事件”作为分类变量的水平,也可以使用任何其他对您而言最合理的、特异性实验指示变量。