Prism 提供了两种不同的方法来执行 Kaplan-Meier 生存分析,具体取决于您的数据结构:
1.生存数据表:这是传统方法,将事件发生时间数据和删剪信息直接输入到专门的生存数据表格格式中。本页详细介绍了该方法。
2.多变量数据表:此方法允许您通过多变量数据表进行生存分析,当需要将生存数据与其他类型数据整合,或从其他来源导入数据时,这种方式更为便捷。有关数据结构要求以及如何通过多变量数据表设置生存分析的详细信息,请参阅《基于多变量数据表的生存分析》。
两种方法产生的统计结果完全一致。主要区别在于数据结构以及分析参数对话框中的若干细微差异,具体如下所述。
生存分析在 Prism 提供的各类分析中独具特色。当数据输入生存数据表时,Prism 会自动对数据进行分析并生成 Kaplan-Meier 生存曲线。您无需通过“分析”工具栏按钮或从“分析”菜单中选择分析来启动分析,也无需在分析参数对话框中指定任何选项。Prism 将使用默认选项进行分析并为您生成结果。
若要查看分析中指定的选项,您可从生存分析结果表中访问分析参数对话框。只需单击分析参数工具栏按钮即可调出该对话框。
在基于生存数据表进行生存分析时,需指定数字代码来表示截尾和事件。默认设置是使用代码“1”表示目标事件发生,使用“0”表示观察值被删剪。这些代码几乎是通用的。不过,某些机构采用相反的约定。在 Prism 中,这些代码可以手动指定,但必须是整数值。

当基于多变量数据表进行生存分析时,“输入”部分的工作方式有所不同。您不再使用数字代码,而是指定“数据”选项卡中设定的变量作为分组变量,并使用该变量的文本值。这些值代表删剪和事件类别。这使您能够使用数据中可能已存在的描述性标签(例如“男性”和“女性”,或“死亡”和“存活”)。 如果指定的变量包含超过两个水平,您还可以指定如何处理不属于这两个类别的其他值 - 通常这些值会被视为缺失数据。

要比较两条生存曲线,Prism 提供了两种方法:
•对数秩检验。计算此检验有两种方法。两者几乎等效,但在处理完全同时发生的多重事件(数据中称为“平局”)时可能略有差异。Prism采用Mantel-Haenszel方法,但使用“对数秩检验”这一名称,该名称通常用于指代这两种方法。此方法也被称为Mantel-Cox方法。
•Gehan-Breslow-Wilcoxon 检验。该方法更重视早期时间点发生的事件,这很有道理(事件发生得越早,越可能是重要的观察结果,因为预计所有研究参与者最终都会经历该目标事件)。然而,当大量研究参与者在早期时间点被删剪时,该检验的结果可能会产生误导。 相比之下,对数秩检验对所有时间点的观测值赋予同等权重
对数秩检验更为标准。若比例风险假设成立,该检验在两种检验中具有更高的检验力。比例风险意味着在所有时间点上,风险函数(单位时间内的死亡人数)的比值保持恒定。比例风险的一个例子是:在所有时间点上,对照组的死亡率是治疗组的两倍。
Gehan-Breslow-Wilcoxon检验不要求风险比保持恒定,但要求其中一组的风险始终高于另一组。
如果两条生存曲线相交,则意味着一组在早期时间点风险较高,而另一组在后期时间点风险较高。这可能仅仅是随机抽样的巧合,比例风险假设仍然成立。但如果样本量较大,当生存曲线在时间进程的中间附近相交时,无论是对数秩检验还是Wilcoxon-Gehan检验都无济于事。
如有疑问,请报告对数秩检验(该方法更为标准)。仅当有充分理由时,才选择Gehan-Breslow-Wilcoxon检验。
当存在三个或更多不同组别(数据集)时,Prism 提供了三种方法来比较生存曲线。对数秩检验和 Gehan-Breslow-Wilcoxon 检验的详细说明与前一节中关于比较两条生存曲线的内容相同。
•对数秩检验。这是比较三条或更多曲线时最常用的检验方法
•趋势对数秩检验。仅当组别顺序(由数据表中的数据集列定义)具有逻辑性时,此检验才适用。 例如,当组别为不同年龄组、不同疾病严重程度或不同药物剂量,且各组均按某种逻辑顺序(升序或降序)排列时。Prism 中数据集从左到右的排列顺序必须与等间隔的有序类别相对应。如果数据集未按顺序排列 - 或间隔不均等 - 则选择对数秩检验毫无意义
•Gehan-Breslow-Wilcoxon检验。该方法赋予早期时间点更大的权重。仅当有充分理由时才应选择此检验。Prism使用下方参考的Machin著作中的方程10.2来计算此检验
Prism 5 及更早版本采用许多教科书中提到的保守方法来计算三组或更多组间的 P 值。对于每条曲线,该方法通过比较观察到的死亡人数与预期死亡人数来计算卡方检验值。随后将这些卡方检验值相加得到总体卡方检验值,进而确定 P 值。 其数学表达式如下,其中 Oi 表示曲线 i 中的观察死亡数,Ei 表示预期死亡数:

该保守方法见于 Machin (1) 的文献,易于理解且效果尚可。问题在于 P 值过大(这就是“保守”的含义)。仅当您希望结果与 Prism 5 及更早版本的结果一致时,才应选择此方法。否则,请选择推荐的方法以与 SPSS 和 SAS 保持一致。
在比较三个或更多组的生存曲线时,Prism 还可以使用一种在 SPSS 和 NCSS 手册中详细说明的方法来计算 P 值。该方法只能通过矩阵代数来理解,其细节超出了本指南的范围。与保守法类似,此方法也会计算卡方检验统计量。 对于这两种方法,自由度均等于组数减 1。区别在于,该方法计算出的卡方检验值大于保守法生成的值,因此相应的 P 值也更小。
结果的计算和呈现方式(百分比或分数、死亡率或生存率)也可在“分析参数”对话框中指定。
若选择绘制 95% 置信区间,Prism 提供两种选项。默认采用变换法,该方法绘制不对称置信区间。另一种选择是采用对称的格林伍德(Greenwood)置信区间。不对称区间更具统计有效性,是推荐选项。
选择对称区间的唯一原因是与 Prism 4 及更早版本计算的结果保持一致。请注意,“对称区间”绘制时并不总是呈对称状。这些区间是通过在确定的生存百分比值基础上加减一个计算值来计算的。 此时,区间始终是对称的,但可能低于 0 或高于 100(对于百分比而言这毫无意义)。在这些情况下,Prism 会修剪区间,使其无法延伸至 0 以下或 100 以上,从而导致区间看起来不对称。
通过复选框,您可以决定是否绘制删剪观测值。唯一例外是当最大的 X 值(时间)被删剪时,该值始终会显示,无论您是否选择显示删剪值。
最后,通过勾选复选框,您可以指定是否在生存分析图中包含动态风险人数表。
选择结果表中显示的小数位数,并指定计算出的 P 值的格式
3.David Machin, Yin Bun Cheung, Mahesh Parmar, 《生存分析:实用方法》,第2版,ISBN:0470870400。