Please enable JavaScript to view this site.

本页面所述的功能均包含在我们的全新 Pro 和 Enterprise 订阅中。了解更多...

当您从多变量数据表运行 Kaplan-Meier 生存分析时,分析参数对话框的第一个选项卡是“数据”选项卡。在此处,您需要告知 Prism 哪些列包含生存时间数据、哪些列表示删剪数据,以及哪些列定义了您想要比较的组。

变量分配概览

“数据”选项卡包含两个主要部分。左侧显示数据表中所有可用变量,右侧则有三个分配框,您可将变量拖拽至其中以指定其在分析中的作用。

要分配变量,您可以将其从左侧拖拽至右侧相应的框中,或者点击每个分配框中的“+ 添加变量...”按钮并从列表中选择。分配完成后,您可将鼠标悬停在变量上,点击出现的“X”按钮将其移除。

状态(删剪)变量

生存分析中的状态变量也称为截尾指标。该变量用于告知 Prism 每个受试者是否经历了您正在追踪的事件,还是发生了删剪(失访、研究结束时仍存活等)。

该变量通常包含 0 和 1 这样的值,其中一个值表示事件发生,另一个值表示删剪。常见的编码方案包括:

1 = 事件发生,0 = 删剪(最常见)

0 = 事件发生,1 = 删剪(有时用于较早期的临床试验数据库)

您稍后将在“方法”选项卡中指定数据采用的编码方案。目前只需指定包含这些事件/删剪指示符的变量即可。

不过,您也可以选择在此处分配一个分类型变量。在这种情况下,您可以指定所选分类型变量的哪个水平对应于删剪观测值,哪个水平对应于事件。这可以简单地将“删剪”和“事件”作为分类型变量的水平,也可以使用任何其他对您而言最合理的、特异性实验指示符。

分配多个状态变量

“多变量”表格的一个强大功能在于,您可以在单次分析中分配多个状态变量。当您需要追踪多种类型的事件,并希望为每种事件分别绘制生存曲线时,此功能非常有用。

例如,在癌症临床试验中,您可能需要分别设置以下状态变量:

死亡(总生存期)

疾病进展(无进展生存期)

治疗中止

您可以将所有这些都设为状态变量,Prism 将分别对每个变量进行分析。如果您还设置了分组变量,您将获得状态变量与分组之间每种组合的生存曲线。因此,如果有 2 个状态变量和 2 个分组,您将得到 4 条生存曲线。

状态变量的要求:

可以是数值型(0/1、1/2 等)或文本型(“事件”/“删剪”、“是”/“否”等)

必须恰好包含两个唯一值(一个表示事件发生,一个表示删剪)

您指定的所有状态变量必须采用相同的编码方案

响应变量的良好示例:

死亡(1 = 已死亡,0 = 存活/删剪)

事件(1 = 发生,0 = 删剪)

状态(事件/删剪)

进展(1 = 进展,0 = 无进展/删剪)

失败(是/否)

时间变量

时间变量包含每位受试者的生存时间或随访时长。这会告知 Prism 每个事件何时发生,或每位受试者何时被删剪。

时间变量必须为连续型且数值型。常见的时间单位包括天、周、月或年,具体取决于您的研究。所有值应采用相同的单位,且您使用的单位将显示在生存曲线坐标轴上。

时间变量的要求:

必须为连续数值数据

所有值应为零或正数(负生存时间没有意义)

所有值必须采用相同的单位

每次分析只能指定一个时间变量

时间变量的良好示例:

Survival_Days

随访_月

事件发生时间_年

疾病进展天数

研究周数

您为该变量命名的名称将自动显示在生存曲线的 X 轴标签上,因此请使用包含单位的描述性名称。

分组变量

分组变量是可选的,但它们能让您比较研究中不同组别(如治疗组、疾病分期、风险类别、人口统计组等)之间的生存曲线。如果您未指定任何分组变量,Prism 将为所有数据生成一条单一的生存曲线。

当您指定一个或多个分组变量时,Prism 会针对每个独特的分组水平组合生成独立的生存曲线,并执行对数秩检验进行比较。这是检验不同组间生存情况是否存在差异的主要方法。

指定多个分组变量

您可以指定多个分组变量来考察因素的组合。例如,您可以同时按“治疗”(对照组与药物组)和“分期”(早期与晚期)进行分组。Prism 将为以下四种组合分别生成生存曲线:对照-早期、对照-晚期、药物-早期和药物-晚期。

这对于探索性分析非常有用,但请注意以下几点:

分组变量越多,生存曲线和比较就越多

每个组合都需要足够的样本量才能获得有意义的结果

当分组数量较多时,生存曲线可能难以通过视觉进行解读

对于复杂分析,请考虑是否应改用多变量Cox回归

分组变量的要求:

必须是分类变量

可包含两个或更多分类

分组标签的拼写和大小写需保持一致

可以是文本或数字编码(但数字编码将被视为类别)

分组变量的良好示例:

治疗组(对照组、药物A、药物B、联合用药)

分期(I、II、III、IV)

风险组(低、中、高)

年龄组(50岁以下、50至65岁、65岁以上)

性别(男性,女性)

反应(完全缓解、部分缓解、无反应)

基因型(野生型、存在突变)

变量赋值示例

让我们来看几个常见场景,以及如何为每个场景分配变量。

场景 1:简单的生存曲线(无分组)

您只想查看整个队列的总体生存曲线,而不进行组间比较。

变量赋值:

状态(删剪):Event_Status

时间:Survival_Days

分组:无

结果:一条生存曲线,显示所有受试者合并后的随时间推移的生存概率。

场景 2:比较两个治疗组

您希望比较对照组和治疗组之间的生存情况。

变量分配:

状态(删剪):死亡

时间:随访月数

分组:治疗组,取值为“对照组”和“治疗组”

结果:两条生存曲线(每种治疗各一条),并使用对数秩检验进行比较。

场景 3:同一分析中的多个结局

您正在同时追踪死亡和疾病进展,并希望查看每个治疗组的两种生存曲线。

变量分配:

状态(删剪):死亡 且 疾病进展(两者均被分配)

时间:随访月数

分组:治疗组,取值为“对照组”和“治疗组”

结果:四条生存曲线:

死亡-对照组

死亡-治疗组

疾病进展-对照组

疾病进展-治疗组

并对每个结局分别进行Log-rank检验。

情景 4:多因素分层分析

您希望了解不同治疗方案与疾病分期组合下的生存情况有何差异。

变量分配:

状态(删剪):Event_Status

时间:Survival_Days

分组:治疗 且 分期(均已分配)

结果:若治疗有 2 个水平,分期有 3 个水平,则会得到 6 条生存曲线(2 × 3 = 6),代表所有可能的组合。

如何分配变量

有两种方法可将变量分配到相应角色:

方法 1:拖放

1.在“可用变量”列表中点击并按住某个变量名称

2.将其拖动到右侧相应的分配框中

3.松开鼠标将其放入框中

方法 2:添加按钮

1.在任意赋值框中点击“+ 添加变量...”按钮

2.从弹出的列表中选择或搜索要赋值的变量

要删除变量:

将鼠标悬停在变量上,然后点击赋值框中变量名称旁边的“X”按钮

该变量将返回“可用变量”列表

常见问题

问:如果我的事件指标使用“死亡”/“存活”等不同代码,而不是 1/0,该怎么办?

答:没问题 - Prism 支持文本代码。只需确保在数据表中将该变量设为分类型,并在“方法”选项卡中指定哪个代码代表“事件发生”。

问:我可以分配多个时间变量吗?

答:不可以,每次分析只能分配一个时间变量。所有受试者必须在同一时间尺度上进行测量,且这些时间值必须记录在数据表中的单一变量中。如果不同结果对应不同的时间单位,则需要分别进行分析。

问:如果同时指定多个状态变量和多个分组变量会怎样?

答:Prism 将为每种组合生成生存曲线。若包含 2 个状态变量和 3 个分组,您将获得 6 条曲线(2 × 3 = 6)。这对于全面的探索性分析很有用,但请确保每种组合中都有足够的事件。

问:Prism 如何处理包含缺失值的行?

答:Prism 会自动排除响应变量、预测变量或任何指定分组变量中存在缺失值的行。分析中仅包含完整案例。

问:我的数据包含随时间变化的协变量或竞争风险。可以在这里进行分析吗?

答:Kaplan-Meier 分析假设协变量与时间无关且仅存在单一类型的事件。对于随时间变化的协变量,您需要使用 Cox 回归。对于竞争风险,您需要专门的生存分析方法,而 Prism 目前尚未提供此类功能。

问:我需要按特定顺序对数据进行排序吗?

答:不需要,行序不影响分析结果。Prism 会根据时间和分析及绘图需求在内部进行排序和分组。