|
Navigation: 使用 PRISM 进行统计分析 11 > 生存分析 > Kaplan-Meier 生存分析结果 Q&A: 生存分析 |
Scroll Prev Top Next More |
Prism 提供了两种选择: 1.对称法是 Prism 4 及更早版本中唯一提供的方法,目前仅出于兼容性考虑而保留。该方法采用 Greenwood 法,我们不建议使用。 2.非对称法更为精确,且是推荐方法。该方法在 Machin (1) 一书的第 42 页和第 43 页中有详细说明。该书虽未给此方法命名或提供参考文献,但其原理是:首先进行一次变换(平方根和对数),使生存的不确定性接近正态分布。然后在此变换尺度上计算标准误差和对称的 95% 置信区间。 最后,将置信区间反变换回原始尺度。 |
生存分析通常计算中位生存时间及其置信区间。原因在于,一旦生存曲线下降至50%以下,中位生存时间便已完全确定,即使仍有许多受试者尚未经历目标事件。而且,即使部分受试者的数据被删剪,中位生存时间依然成立。 相比之下,在所有受试者都经历目标事件之前,平均生存时间根本无法定义。只有当您知道每个受试者的生存时间(即没有受试者被删剪)时,才能计算出该值。由于只有极少数研究满足这些条件,因此 Prism 不计算平均生存时间。 但有一个简单的变通方法。如果您已知每个受试者的生存时间,只需将其输入到列表中,并执行“描述性统计”分析,即可计算这组值的均值和置信区间。 |
如果已知各时间点的生存百分比,Prism能否生成生存曲线?Prism 只能基于生存数据表中的原始数据生成 Kaplan-Meier 生存曲线,并使用对数秩检验(或 Gehan-Breslow-Wilcoxon 检验)对这些曲线进行比较。 如果您已知每个时间点的生存概率,且仅需绘制图表,则不应将数据输入生存数据表。相反,应创建一个 XY 数据表。将每个时间点作为 X 值(数字,而非日期)输入,并将这些时间点的对应生存概率作为 Y 值输入(不使用子列)。 如果您还掌握各时间点生存概率的标准误差信息,可以将 XY 数据表设置为允许在 Y 列的子列中输入该信息,使用“输入并绘制已在其他地方计算的误差值”格式,并选择“均值与标准误差”选项。 数据输入正确后,您可以对生成的图表进行优化。若希望图表包含阶梯式曲线(生存曲线的传统样式),请打开“设置图表格式”对话框,在“显示连接线/曲线”部分,从样式下拉菜单中选择“生存曲线”。
如果您在 XY 表格中输入生存百分比,将无法进行生存分析计算。您将无法计算误差条或置信带,也无法使用 Prism 提供的检验方法比较生存曲线。 |
如果没有删剪观察值如果您对每位受试者进行随访直至目标事件发生(该事件通常为死亡,但生存曲线也可追踪至任何一次性事件发生的时间点),则曲线最终将趋近于 0。当最后一位受试者经历目标事件时(即时间点 X),生存概率将为零。 如果所有受试者的随访时间完全相同如果所有受试者的随访时间完全相同,情况就很简单。如果到研究结束时,仍有三分之一的受试者未经历目标事件,那么生存概率就是33%。 如果部分受试者在随访过程中被删剪如果任何受试者的观察数据被删剪,则生存曲线的最低点将不等于那些在研究结束前未经历目标事件的受试者所占的比例。 在删剪之前,受试者会贡献生存率的分数值;删剪之后,其数据不再影响计算。在任意给定时刻,生存概率值即为截至该时间点仍存活的受试者所占比例。 因退出研究或研究结束而观测值被删剪的受试者,无法提供删剪时间点之后的信息。您无法确定他们在删剪时间点之后是否会经历目标事件(或者虽知晓,但因不再遵循实验方案而无法使用该信息)。 因此,如果任何受试者在生存曲线X轴上显示的最后时间点之前被删剪,则生存图上显示的最终生存概率将无法反映实际未经历目标事件的受试者比例。那个您可以轻松手动计算出的简单生存百分比并没有实际意义,因为并非所有受试者的随访时间都相同。 生存曲线何时会降至零?即使生存曲线最终降至0%生存率,也不意味着研究中的每位受试者都经历了目标事件。部分受试者可能在更早的时间点被删剪(无论是因为退出研究,还是因为研究结束时他们尚未经历目标事件)。只有当最后一个时间点的观测对象是经历了目标事件的受试者(而非被删剪的受试者)时,生存概率才会降至零。 如果您的数据按 X 值排序(Prism 可通过“编辑...排序”实现),当最后一个 Y 值为 1(发生目标事件)时,曲线将下降至 0% 生存率;而当最后一个 Y 值为 0(被删剪)时,曲线将结束于 0% 以上。 在下示例中,目标事件为死亡。十名受试者中有四人死亡。但生存曲线下降至零,而非60%。为什么?因为有六名受试者在1至27个月期间被删剪。 我们无从知晓若他们能坚持至第28个月会发生什么。由于无法确定他们是生是死,删剪时间之后的数据便不再计入(但删剪时间之前的数据则完全计入)。在第27个月时,仅有一名受试者仍在随访,而该受试者在第28个月死亡,导致生存概率降至零。
|
中位生存时间是指达到50%生存率所需的时间。如果研究结束时超过50%的受试者仍存活,那么中位生存时间就无法确定。 P值来自对数秩检验,该检验比较的是整个生存曲线,即使生存概率始终大于50%,该检验也能正常工作。即使两条曲线的生存概率从未低于50%,它们也可能存在显著差异。 |
Prism在计算生存曲线时,还能针对每个时间点计算95%置信区间(采用两种替代方法)。这些方法虽为近似计算,但可像任何置信区间一样进行解读。 您已知研究中某特定时间点的观察生存概率,并可在95%的置信水平下(基于一系列假设)确信该置信区间包含真实总体值(若要完全确定该值,需对研究总体的每个成员进行观测 - 若研究对象为人类,则意味着所有现存的每一个人)。 当这些置信区间以误差条形式绘制时(下图左侧),并无问题。Prism 还可以连接这些误差条的两端并生成一个阴影区域(下图右侧)。该生存曲线仅绘制了由七名个体组成的样本的生存情况,因此置信区间非常宽。 该阴影区域看起来与线性和非线性回归计算出的置信带相似,因此人们很容易将其解读为置信带。然而,若断言“可以95%确信这些带包含整个生存曲线”,这种说法是不正确的。正确的表述应是:在任何时间点,您都可以95%确信该区间包含真实的生存概率。 真实的生存曲线(您无法确知)在某些时间点可能位于置信区间内,而在其他时间点则可能位于置信区间外。
虽然(但 Prism 无法做到)可以计算生存曲线的真实置信带,且其宽度大于上文所示的置信区间。换言之,在所有时间点上以 95% 的置信度包含整个生存曲线的置信带,其宽度大于单个时间点的置信区间。 |
在分析生存数据时,Prism 会直接忽略所有 X=0 的行。其逻辑很简单:如果替代治疗在第 0 时刻开始,那么在治疗开始的瞬间发生死亡,将无法提供任何有助于判断两种治疗方案孰优孰劣的信息。X 值并不要求必须是整数。如果死亡发生在治疗开始半天后,而 X 值是以天为单位统计的,只需将该受试者的观察时间输入为 0.5。 某些领域(如小儿白血病)确实将时间零点的事件视为有效。这些研究不仅追踪死亡,还追踪疾病复发前的生存时间。但疾病必须先进入缓解期,才可能复发。在某些小儿白血病试验中,治疗在时间零点前 30 天开始。大多数患者在时间零点时已处于缓解期。随后对患者进行随访,直至死亡或疾病复发。 但对于那些从未进入缓解期的受试者又该如何处理?部分研究者将这些情况视为时间零点的事件。某些研究方案会将时间零点的事件纳入考量,因此Kaplan-Meier生存曲线起始时的生存概率将低于100%。若某治疗组中有10%的患者从未进入缓解期,生存曲线将从Y=90%开始,而非100%。 我们尚未对Prism进行修改以处理发生在时间零点的事件,原因如下: •我们尚未见到任何科学论文或教科书解释分析“时间零点”死亡事件的含义。这似乎远非标准做法 •将两个截然不同的问题(有多少比例的患者进入缓解期?处于缓解期的患者能维持缓解多久?)的答案合并到同一条生存曲线中,似乎是不恰当的 •如果我们将 X=0 的数据纳入分析,我们无法确定生存分析的结果(中位生存时间、风险比、P 值等)是否具有实际意义 根本问题在于:生存分析利用的数据是以“目标事件发生前经过的时间”形式呈现的。通常该事件是死亡。通常是其他某种明确定义的事件,且每个受试者仅会发生一次。此外,该事件被定义为 - 理论上 - 只要时间足够长,试验中的每位参与者都可能经历的事件。 在这些儿童白血病试验中,该事件被定义为疾病复发。但显然,除非疾病首先进入缓解期,否则无法复发。因此,生存分析实际上是用来追踪两个不同事件中第二个事件发生前经过的时间。这导致了一个问题:如何分析那些从未进入缓解期的患者的数据(第一个事件从未发生)。 我们愿意重新考虑此前对X=0的生存数据采取忽略(而非分析)的处理方式。如果您认为我们的决定有误,请告知我们。如有可能,请提供参考文献。 如果您确实希望进行数据分析,且希望将时间零点时的死亡病例纳入计算以使起始点低于100%,有一个简单的解决方法:只需输入一个小于零的微小数值。例如,将X设为0.000001。另一种方法是先将数据输入为X=0,然后使用Prism的转换分析功能,并采用以下用户自定义转换公式: X=IF(X=0, 0.000001, X) 在此分析结果中,所有 X=0 的值都将转换为 X=0.000001。从该结果表中,点击“分析”并选择“生存分析”。 |
Prism采用Kaplan-Meier乘积极限法计算生存概率。这是一种标准方法。唯一的难点在于如何处理删剪观测值。 考虑一个简单示例。初始样本为 16 人。其中 2 人在 15 个月的首次事件发生前即被删剪。由于在首次事件发生时,这 2 人不被视为处于“风险”人群中,因此未被纳入生存概率计算。 因此,15个月时的生存概率从100%(16/16=100%)降至92.86%(13/14=92.86%)。分母14表明,在剔除先前被删剪的两人后,“风险”人群中的个体数仅剩14人。 在93个月的下一个事件发生前,又有7名个体被删剪。因此,在存活超过15个月的个体中,我们知道有83.3%(5/6=83.3%)在93个月后仍然存活。 但这只是相对下降。若要计算0个月时存活且在93个月后仍存活的人数百分比,必须将92.86%(首次事件发生时的生存率)乘以83.3%(第二次事件发生时的生存率),结果为77.38%。 这便是Prism软件在93个月时报告的生存概率。这也是为何Kaplan-Meier法(Kaplan-Meier method)也被称为乘积极限法。有关该方法的更多详情,请参阅此页面。 |
1.David Machin, Yin Bun Cheung, Mahesh Parmar, 《生存分析:实用方法》,第2版,ISBN:0470870400。