从数据表中选择包含分析中目标事件发生前经过时间的变量。请注意,目前 Prism 仅接受用于 Cox比例风险回归的经过时间。如果您的数据包含“开始时间”和“结束时间”变量,则需要将它们转换为每个观测值的单一经过时间值(经过时间 = 结束时间 - 开始时间)。
从数据表中选择包含各观测值相关信息的变量,该变量需标明目标事件是否发生或观测值是否被删剪。该变量可以是连续型或分类型。若该变量为连续型,通常采用编码方式:值“1”表示发生目标事件的个体,值“0”表示被删剪的个体。 若该变量为分类变量,其分类水平可能易于解读,例如“死亡”和“删剪”。无论结果变量是连续型还是分类型,本选项卡中的控件均可让您指定哪个值(或分类水平)代表事件,哪个代表删剪观测值。
此外,"将其他值视为"下拉菜单允许您指定 Prism 应如何处理所选变量中的其他值。根据所选选项,这些行可能被视为:
•缺失值。选择此选项时,Prism 将把任何值与“删剪”和“事件”指定值不同的行,视为该行中该变量完全没有值。因此,这些行将被排除在分析之外。这是此下拉菜单的默认选项
•删剪:选择此选项时,值与“删剪”和“事件”中指定值不同的行将被视为删剪观测值。如果您的数据在录入(或编码)时已考虑多种删剪类型(例如“因缺乏随访而丢失”或“研究结束时存活”),此选项将非常有用
•死亡/事件:选择此选项时,除“删剪”和“事件”中指定值以外的任何行值都将被视为事件。仅当您关注所有事件发生的概率(而非不同事件之间的差异)时,才应选择此选项。 例如,若研究的是总体生存概率,将“因车祸死亡”与“因心脏病发作死亡”视为同类可能尚可接受;但在考察实验性治疗对心力衰竭影响的研究中,将这两者等同对待可能并非明智之举(在此情况下,“因车祸死亡”通常应被视为删剪观测值)
Cox比例风险回归模型要求记录每个观测值的事件发生时间,且这些时间的顺序对分析计算至关重要。然而,通常会出现多个事件记录的经过时间相同的情况(无论是由于数据收集方式所致,还是因为事件的具体顺序未知)。 当事件观测值的经过时间相同时,这些观测值被称为“并列”,分析中存在多种处理并列的方法。默认情况下,Prism将自动选择最佳的并列处理方法。根据并列观测值的数量,Prism将采用精确法或Efron法(更多信息请见下文)。 Breslow 法仅用于匹配其他应用程序生成的结果,通常不建议使用。
精确法通常被认为是最准确的,在执行所需计算时,它会考虑所有可能的并列事件排序排列。例如,如果观测值 A、B 和 C 并列,则有六种不同的排列方式:
1.A, B, C
2.A, C, B
3.B、A、C
4.B, C, A
5.C, A, B
6.C, B, A
随着数据集中平局数量的增加,排列的总数会迅速增加,导致计算时间急剧增加。为了解决这个问题,人们开发了一些精确方法的近似方法。最常见的两种近似方法是:
1.布雷斯洛近似法
2.埃夫隆近似法
布雷斯洛近似法是这两种方法中较早出现的一种,其精度低于埃夫隆近似法,尤其当数据中存在大量并列值时。因此,除非需要特意匹配其他应用程序生成的结果,否则我们不建议使用布雷斯洛近似法。 请注意,比较不同估计方法的一种方式是对比使用每种估计方法进行模型拟合所得的AIC值。该值在结果的模型诊断部分中报告。
与多元线性回归和多元逻辑回归类似,Cox比例风险回归可将连续变量和分类型变量均作为模型中的预测变量。然而,这些分析与其他分析相比的一个重要区别在于,Cox比例风险回归中不存在明确的截距项。如果包含截距项,它将被未指定的基线风险 (h0(t)) 所“吸收”。
主效应既可能是您正在研究的变量(如治疗组或基因型),也可能是您仅用于校正的变量(如年龄、性别、体重等协变量)。尽管这些变量的解读可能不同,但在模型定义层面并无区别。 使用复选框指定要纳入模型的预测变量。拟合模型时,Prism 将为模型中每个选定的主效应估计一个回归系数(β系数)。当包含分类预测变量时,该预测变量的估计回归系数数量等于分类变量的水平数减一(例如,一个具有四个水平的分类预测变量将产生三个估计回归系数)。 对于模型中包含的每个交互作用和转换项,系统也会分别估算相应的回归系数(见下文)。
Prism 使您能够非常轻松地在模型中加入任意数量的独立预测变量的二元或三元交互作用。 只需展开您想要包含的交互作用(二元或三元)列表,选择您想要添加的交互作用中的第一个预测变量,然后选择要包含在该交互作用中的变量。要选择与给定预测变量的所有可能交互作用,只需在“定义模型”窗口的二元或三元交互作用部分中,选中该预测变量旁边的主复选框即可。
除了交互作用外,Prism 还允许您将任何预测变量的平方、立方、平方根、对数或指数纳入模型。只需展开所需的转换部分,然后通过复选框指定您希望作为分析模型一部分进行转换的预测变量。