
上图中的两幅图均显示了剂量-反应曲线,其中每个反应点均通过十个重复测量值来衡量。在左图中,这些重复测量值的标准差保持恒定,在整个曲线上大致相同。在右图中,重复测量值的标准差与Y值相关。随着曲线上升,重复测量值之间的变异性也随之增加。
这些数据是模拟生成的。在两种情况下,重复测定值之间的离散程度均来自高斯分布。在左侧图表中,该高斯分布的标准差在所有剂量下均保持不变。在右侧图表中,标准差是平均Y值的固定比例。当一个响应值是另一个响应值的两倍时,重复测定值之间的标准差也是其两倍。换言之,变异系数(CV)是恒定的。
如果对右侧数据拟合模型时,未考虑散布随 Y 值增加而增大的事实,会发生什么情况? 考虑两种剂量,它们产生的响应值相差两倍。对于响应值较高的剂量,重复测定值与真实曲线的平均距离将是前者的两倍。由于回归分析旨在最小化这些距离的平方和,因此预期这些点对平方和的贡献将是平均Y值较小点数的四倍。 换言之,平均 Y 值是另一组两倍的重复数据集,其权重将增加四倍。这本质上意味着,曲线拟合过程将更努力地使曲线靠近这些数据点,并相对忽略 Y 值较低的数据点。若要使两组对平方和的贡献相等,低值组的数据点数量需增加四倍。
加权的目标是让曲线上任何位置的数据点对平方和的贡献度均等。当然,随机因素会导致某些数据点的离散程度高于其他数据点。但加权的目标是使这些差异完全由随机性决定,而非与 Y 值相关。术语“权重”稍显误导,因为目标是消除高 Y 值数据点上的额外“权重”。其真正目标是“去权重”。
Prism 在非线性回归的“方法”选项卡中提供了六种选择,并允许您测试是否采用了适当的加权方案。