Please enable JavaScript to view this site.

变量

回归模型是根据一个或多个自变量 X 来预测因变量 Y。因变量 Y 也称为因变量响应变量结果变量。自变量 X 也称为自变量解释变量预测变量

每个 X 变量可以是实验者操纵的数值、实验者选择或分配的处理方式,或是实验者测量的数值。

每个自变量可以是:连续型(例如年龄、血压、体重)或分类型(例如性别,其取值为男性和女性;或细胞系,其取值为HeLa、HEK 298、CHO和Jurkat)。当使用分类型变量时,必须使用多种方法之一对其进行“编码”(下文将详细说明)。 请注意,当分类变量被纳入回归模型时,Prism会自动对其进行编码,因此无需手动执行此操作。

参数

多元回归模型将因变量定义为自变量与一组参数(也称为回归系数)的函数。回归方法旨在寻找使模型预测值尽可能接近实际数据的各参数值。这种方法类似于线性回归 - 后者通过确定斜率和截距(即模型的两个参数或回归系数)的值,使模型能尽可能精确地根据 X 预测 Y。

简单回归与多元回归

简单回归指仅含一个自变量 X 的模型。多元回归(也称为多变量回归)指包含两个或更多自变量 X 的模型。

单变量与多变量回归

尽管这超出了本指南的范围,但确实存在能够同时分析多个结果变量(Y变量)的方法。这些被称为多变量方法,包括因子分析、聚类分析、主成分分析和多重方差分析(MANOVA)。这些方法与仅处理单一Y变量的单变量方法形成对比。

请注意,“多变量”和“单变量”这两个术语的使用并不一致。有时,“多变量”用于指代具有一个因变量和多个自变量的多变量方法(即多重回归和逻辑回归)。而有时,“单变量”则用于指代仅有一个自变量的简单回归。

线性与非线性多元回归

Prism 仅执行线性多元回归。这意味着每个参数与 Y 呈线性关系。若绘制 Y 随任一参数变化的曲线(同时保持所有 X 值及其他参数恒定),该曲线将是一条直线。

当然,完全可以构建包含一个因变量 Y 及多个自变量 X 的模型,这些自变量通过非线性函数与 Y 相关联。但 Prism 目前尚不支持多重非线性回归。若此功能对您有帮助,请告知我们并提供详细信息。

变量编码(“虚拟变量编码”)

分类变量是指只能取有限数量的可能值(称为“水平”)的变量。 例如,“汽车制造商”可以是一个分类变量,其水平包括“福特”、“丰田”、“道奇”、“现代”等。然而,回归模型依赖于变量具有数值来执行必要的计算。因此,为了将分类变量纳入回归模型,必须将其转换为仅由数字组成的变量(更准确地说是一组变量)。