当将一个分类预测变量作为预测因子纳入回归模型时,Prism 会自动使用“虚拟编码”对该变量进行编码。此过程会在后台生成若干个新变量,其数量等于原始分类变量的水平数减一。例如,如果一个分类变量有五个不同的水平(A、B、C、D 和 E),虚拟编码将生成四个新变量。 如果一个分类变量只有两个独特水平(例如男性和女性),虚拟编码只会生成一个变量。这样,除一个水平外,分类预测变量的每个水平都会获得一个用于回归分析的新变量。此外,还会为这些新变量中的每一个计算一个β回归系数。
但这些β系数代表什么?而那个未生成新变量的水平又如何?这两个问题都与分类预测变量“参考水平”概念有关。
分类预测变量的参考水平通常被视为该变量所观察到的“基线”或“通常”值。在虚拟编码过程中,参考水平的变量会被省略,因为它对每个观测值都仅包含“0”。相反,参考水平被用作解读生成的回归模型的一种手段。让我们通过一个例子来说明这一点:
假设有一个模型包含分类预测变量“性别”,其取值为“男性”和“女性”。如果“男性”是我们的参考水平,那么预测模型将包含“女性”的β系数(及风险比),但不会包含“男性”的β系数。 在此情况下,“女性”的风险比告诉我们,在其他变量保持不变的情况下,女性的危险率是男性的多少倍。换言之,如果“女性”的风险比为3.658,则预期女性的危险率是男性的3.658倍。 请注意,这种解读同样可直接应用于参数估计值(β系数),但“对数风险”的概念并不直观,因此在解读这些数值时,我们通常会使用风险比(等于 exp(β))而非直接使用 β。

在“参考水平”选项卡中,回归模型中包含的每个分类预测变量都会列在“定义参考水平”下。对于每个变量,您可以选择让 Prism 自动定义参考水平(基于指定的规则),或者手动定义一个水平。在自动指定参考水平时,Prism 提供多种可选规则,包括:
•第一层(默认)。Prism 将选择数据表中该变量的第一层。请注意,如果数据表中行序发生变化,该参考层级也可能随之改变!
•最后一个水平。Prism 将选择数据表中该变量的最后一个水平。请注意,如果数据表中行序发生变化,该参考水平也可能随之改变!
•最频繁水平。Prism 将确定该变量中出现频率最高的水平,并将其作为参考水平。若您希望回归系数能反映罕见水平相对于常见水平的影响,此选项非常适用。请注意,更改数据表中行顺序不会导致此参考水平改变。但添加或删除数据可能会导致参考水平改变(因各水平的出现频率发生变化)
•最不常见的水平。Prism 将确定变量中出现频率最低的水平,并将其作为参考水平。请注意,更改数据表中行的顺序不会导致该参考水平发生变化。但是,添加或删除数据可能会导致参考水平发生变化(因为这会改变每个水平的频率)
对于上述用于指示 Prism 如何自动选择参考级别的每条规则,数据的某些更改(组织结构调整或数据的增删)都可能导致自动选定的级别发生变化。 例如,如果您选择了“最后一个级别”规则供 Prism 使用,并在表格底部添加了新的数据行,数据表中的“最后一个级别”可能会发生变化!在“参考级别”选项卡的底部附近,有一个复选框,用于“在数据更改时重新计算自动参考级别”。默认情况下,此复选框是勾选的。 但是,如果您希望确保在数据更新时参考级别不会改变,可以取消勾选此复选框。取消勾选后,您仍可使用规则让 Prism 检查相应的级别,但一旦点击“确定”,数据的更改将不会导致指定的参考级别发生任何变化(Prism 不会“重新检查”,除非您打开“参考级别”选项卡并重新分配规则)。
最后,您还可以通过在第一个下拉菜单中选择“自定义…”并在第二个下拉菜单中选择所需水平,来指定自定义参考水平。
在生成回归分析的结果输出时,Prism 会按数据表中的顺序显示分类预测变量的水平。然而,出于展示或发表的目的,有时可能需要更改回归模型中一个或多个特异性分类预测变量的水平顺序。 “定义参考水平”部分中的“顺序”按钮允许您分别自定义每个分类变量的水平顺序。“定义类别顺序”子菜单中的控件允许您:
•将分类变量的参考水平设为当前选定的水平
•手动重新排序分类水平(“顶部”、“向上”、“反向”、“向下”和“底部”控件)
•使用三种默认方法之一重新排序:
▪视觉顺序:数据表中层级首次出现的顺序
▪频率:频率较高的水平在排序中靠前
▪字典顺序:按字典顺序排列。类似于字母顺序,但请注意,名为“a100”的水平会排在“a90”之前,因为“1”在“9”之前。此顺序不考虑“100”这个数字整体大于“90”这个数字的事实

默认情况下,分类变量的参考级别被选定为数据表中该变量的第一个级别。Prism 还提供其他自动选项,包括“最后一个级别”、“最频繁级别”和“最不频繁级别”。但是,如果输入数据发生变化(或向输入数据表中添加了额外数据),其中一些自动选项也可能随之改变。 若要确保在输入数据发生变更或添加新数据时,指定的参考水平保持不变,请取消勾选“数据变更时重新计算自动参考水平”旁边的复选框,或通过相应的下拉菜单将各个参考水平设置为“自定义...”。