Please enable JavaScript to view this site.

相关系数

相关系数 r 的取值范围为 -1 到 +1。非参数斯皮尔曼相关系数(简称 rs)的取值范围与此相同。后者有时用希腊字母 ρ(rho)表示。

r(或 rs)的数值

解读

1.0

完全相关

0 到 1

这两个变量往往同步增减。

0.0

这两个变量完全没有同步变化。

-1 到 0

一个变量增加时,另一个变量减少。

-1.0

完美的负相关或反相关。

如果 r 或 rs 远离零,可能有四种解释:

X 变量的变化会导致 Y 变量的值发生变化。

Y 变量的变化导致 X 变量的值发生变化。

其他变量的变化同时影响 X 和 Y。

X 和 Y 实际上完全不相关,而您只是偶然观察到了如此强烈的相关性。P 值量化了这种情况发生的概率。

关于相关系数的说明:

若选择斯皮尔曼非参数相关分析,Prism 会通过近似方法计算斯皮尔曼相关系数的置信区间。根据 Zar(《生物统计学分析》)的观点,该近似方法仅适用于 n>10 的情况。因此,当 n 较小(即样本量不足)时,Prism 便不会报告斯皮尔曼相关系数的置信区间。

若要求Prism计算相关矩阵(即计算每对变量之间的相关系数),它将针对每对变量计算简单的相关系数,而不考虑其他变量。它不会计算多重回归或偏回归系数。

如果所有 Y 值都相同,则无法计算相关系数(无论是参数的还是非参数的),Prism 会报告“水平线”。相关性考察的是 X 和 Y 共同变化的程度。如果 Y 完全不变化,该问题就失去了意义,相关性计算也无法进行(除以零)。

如果所有 X 值都相同,则无法计算相关系数,Prism 将报告“垂直线”。

r²

或许解读 r 值的最佳方式是将其平方以计算 r²。统计学家将该量称为决定系数,但科学家通常称其为“r 平方”。这是一个介于零到一之间的数值,代表两个变量方差中“共同”的部分所占的比例。 例如,如果 r²=0.59,则 X 的方差中有 59% 可以由 Y 的变化来解释。同样,Y 的方差中有 59% 可以由 X 的变化来解释。更简单地说,X 和 Y 之间共享了 59% 的方差。

Prism仅能根据皮尔森相关系数计算值。不建议使用非参数的斯皮尔曼相关系数来计算R²。

P 值

P值回答了以下问题:

如果 X 和 Y 之间总体上确实不存在相关性,那么随机抽样得到一个与本实验中观察到的值同样远离零(或更远)的相关系数的概率是多少?

如果 P 值较小,则可以拒绝“相关性源于随机抽样”这一假设。

如果 P 值较大,数据无法提供任何依据让您得出相关性真实存在的结论。这并不等同于说完全不存在相关性。您只是缺乏有力证据证明相关性是真实的而非偶然。观察 r 的置信区间,它将从负相关延伸至正相关。 如果整个区间仅包含接近零的数值(您通常认为这些数值在生物学上微不足道),那么就有强有力的证据表明:总体中要么不存在相关性,要么仅存在微弱(在生物学上微不足道)的关联。另一方面,如果置信区间包含您认为在生物学上重要的相关系数,那么您无法从本次实验中得出任何强有力的结论。要得出强有力的结论,您需要来自更大规模实验的数据。

如果您将数据输入到列表中并请求生成相关矩阵,Prism 将报告每列与其他所有列相关性的 P 值。这些 P 值未进行多重比较校正。

Prism 始终报告双尾P值。

Prism 如何计算斯皮尔曼非参数相关性的 P 值

当数据对数量为 17 对或更少时,Prism 会通过考察数据的所有可能排列组合,计算非参数(斯皮尔曼)相关性的精确P值。精确计算可轻松处理平局情况。当数据对数量为 18 对或更多时,Prism 会计算非参数相关性的近似P值。这种近似计算是标准做法。它首先根据相关系数 R 计算 t 比值,然后据此计算 P 值。

如果斯皮尔曼相关系数的精确P值计算被中断(例如,通过按下“ESC”键取消),Prism 将为剩余的相关系数报告近似P值。在分析结果中,Prism 将报告每个计算出的 P 值是斯皮尔曼相关系数的精确值还是近似值。

Prism 5 在无并列值时采用 >13 对作为阈值进行近似计算,而在存在并列值时始终采用近似计算;而现在的 Prism 则采用 >17 对作为阈值。因此,对于包含 14 至 17 对的数据集,或包含少于 17 对但存在并列值的数据集,Prism 5 报告的结果将有所不同(且精度较低)。

Prism 7 修复了 Prism 6(仅限 6.05 和 6.0f 版本,早期版本除外)中的一个错误,该错误会在以下情况下导致 P 值计算错误:当 Rs 为负值、存在并列值且采用精确P值计算时。