•当两个变量共同变化时,统计学家会说它们之间存在显著的共变关系或相关性。
•相关系数 r 用于量化相关性的方向和程度。
•相关性适用于同时测量两个变量(通常为 X 和 Y)的情况,若其中一个变量作为实验的一部分被操纵或控制,则不适用(X 值通常符合这一描述:例如,剂量-反应实验中使用的特异性浓度即为受控值)。
•这两个变量的值几乎总是实数(而非整数、分类变量或计数变量)。
•相关性分析报告相关系数的数值,但不会生成回归直线。若需拟合最佳直线,请选择线性回归。
•请注意,相关分析与线性回归并非同一概念。请回顾两者的区别。特别需要注意的是,相关分析不会拟合或绘制直线。
•相关分析计算相关系数及其置信区间。其取值范围从 -1(完全负相关;一个变量的值增加,另一个变量的值减少)到 1(完全正相关;一个变量的值增加,另一个变量的值也增加)。相关系数为零意味着两个变量的值之间完全没有相关性。
•相关分析还会报告一个 P 值,该值可用于检验零假设:即数据采样自两个变量之间不存在相关性的总体(换言之,零假设为 r=0)。
•皮尔逊相关与斯皮尔曼相关之间的区别在于:只有在假设两个变量的值均来自服从高斯分布的总体时,皮尔逊相关所得的置信区间和P值才具有意义。而斯皮尔曼相关不作此假设。
•如果任一变量仅有两个可能取值,皮尔逊相关分析的结果与点二列相关分析的结果完全一致。