Please enable JavaScript to view this site.

在进行生存分析时,若事件发生时间响应变量数据伴随多个预测变量(包括分类型或连续型预测变量),则无法使用非参数方法(如Kaplan-Meier(乘积极限)估计量)。一种替代方法是使用半参数技术 - Cox比例风险回归。本指南的后续页面将介绍Cox回归的相关背景及数学理论。 如果您只是想了解如何在 Prism 中运行此分析,请直接跳转至该操作指南页面

 

重要提示!

Cox比例风险回归作为 Prism Labs 的最新(且可说是最先进)功能,于 Prism 9.3.0 版本中推出。该分析方法已被公认为生存分析的行业标准,能够对多种不同类型的预测变量(包括分类型和连续型)及其对生存的影响进行复杂的探究。 我们已竭尽全力确保 Prism 生成的结果准确无误。在本指南中,您将找到关于这些结果生成原理的详细说明,以及如何解读多数结果的基本指导。

然而,Cox回归属于高级分析方法 - 甚至可以说比Prism中任何其他分析方法都更为复杂。在使用Cox回归分析数据之前,请务必掌握生存分析的基础知识(即Kaplan-Meier生存估计,以及用于比较所得生存曲线的各种检验:对数秩检验、趋势检验和Gehan-Breslow-Wilcoxon检验)。 Cox回归高度依赖于检验其他形式多元回归(如多元线性回归和逻辑回归)的统计概念。即使掌握了所有这些不同概念,在处理这些复杂技术时,最好的建议始终是寻求统计学家的指导或协助。

 

生存数据的半参数分析

首先,让我们探讨一下“半参数”的含义。在前面的章节中,我们探讨了为何无法使用线性回归分析生存数据。其中一个原因是数据(生存时间)具有高度的偏斜度,且根据定义必须为正值(生存时间不可能为负值)。 线性回归高度依赖高斯分布,但该分布无法很好地描述生存数据。值得注意的是,高斯分布是对称的,且可能包含负值。因此,分析生存数据时可采用其他分布(如威布尔分布、指数分布、对数正态分布等)。 在所有指定了分布的情况中,这些分析都被视为“参数化”分析,因为它们假设数据来自一种可通过一组严格的参数定义的分布(更准确地说,这些分析对风险函数的形式做出了假设,这一点将在后面讨论)。 Cox比例风险回归并未对时间数据的分布做出此类假设,但它对预测变量对生存时间的影响做出了参数化假设。因此,它是一种“半参数”技术。

那么,既然Cox比例风险模型不假设生存数据的分布,它又是如何估计生存曲线(即作为时间的函数给出生存概率的生存函数)的呢?后续章节将深入探讨该技术背后的数学原理,但简短的答案其实就体现在分析方法的名称中:“比例风险”。要理解其含义,我们首先来看看什么是风险率