在“欢迎”或“新建数据表”对话框中,选择创建多变量数据表。如果您刚刚开始接触Cox比例风险回归,且没有自己的数据,可以选择使用示例数据集开始。
与基于多变量数据表进行的其他分析一样,数据结构必须遵循统一规范。数据表的每一行代表一个不同的观测值、个体、动物、受试者等;每一列代表一个不同的变量。
对于Cox比例风险回归,至少需要三个变量:
1.随访时间:每个个体/观测值从开始到发生目标事件或被删剪的时间长度。随访时间可以使用任何方便的单位,例如天、周或月。输入的随访时间值无需四舍五入为整数,可以以小数形式输入。目前,无法为单个观测值输入起始时间和结束时间,并让 Prism 计算其持续时间
2.事件/截尾分类变量:其取值表示个体/观测值是否经历了目标事件或被删剪。该变量可以是连续变量,也可以是分类型变量。通常,此信息被编码为连续变量,其中值“1”表示经历了目标事件的个体,值“0”表示被删剪的个体。 不过,一个包含“死亡”和“删剪”两个水平的分类变量同样适用。无论哪种情况,分析参数对话框中的“模型”选项卡上的控件都将允许您指定哪个值(或水平)代表事件,哪个代表删剪观测。其他控件还将允许您指定如何处理所选变量中的其他值(可将其视为缺失值、事件或删剪观测)
3.至少一个预测变量:Cox 回归中可包含其他变量(分类或连续型),且每个变量应输入到单独的一列中。 请注意,您无需手动编码分类变量。相反,您只需输入文本标签来标识观测值所属的分类变量水平。如果采用这种方式输入数据,请确保数据表中的变量类型已设置为“分类”。请注意,这些额外的预测变量包括
最后,请注意无需手动编码模型中的交互作用。除了指定要纳入模型的预测变量外,若您选择包含交互作用,Prism 还将允许您指定二元和三元交互作用。