Please enable JavaScript to view this site.

Navigation: 统计学原理 > 分析核查清单

分析核查清单:主成分分析(PCA)

Scroll Prev Top Next More

数据

输入数据中是否不含分类变量?

PCA 仅分析连续变量,因此输入数据中的分类变量将被直接忽略。如果您的数据表包含分类变量,它们将不会被纳入主成分生成过程。不过,这些变量可用于自定义分析的图形输出(主成分得分图)。这有助于在主成分得分图上直观地识别特异性目标群体。

选项

如果您选择对数据进行中心化处理(而非标准化处理),是否有充分的理由?

数据标准化后,每个变量(每列)的均值为 0.0,标准偏差 (SD) 为 1.0。数据中心化后,每个变量的均值仍为 0.0,但标准偏差将不相同(每个标准偏差将等于所分析变量的标准偏差)。 仅当所有变量单位一致,且您确知总体上各变量具有相同的标准差(标准差之间的任何差异均源于随机抽样)时,仅进行中心化处理才有意义。这种情况较为罕见,因此若您选择中心化而非标准化,请确保能对此选择提供充分依据。 当选择中心化而非标准化时,变异性较大的变量将对分析产生更大影响,对主成分的确定贡献更大。然而,这可能仅仅是由于测量尺度不同(英寸与英里),从而可能破坏PCA的全部意义。

如果您选择了平行分析以外的成分选择方法,是否有充分的理由?

统计学家普遍认为,与Prism提供的其他方法相比,平行分析是选择主成分的更优方法。虽然软件还提供了其他较旧的方法,但这些方法大多已过时,仅作为验证先前报告结果的手段而保留。除非有充分理由,否则请勿使用它们。

PCA 结果

所选的主成分解释了多少变异量?

建议查看表格结果页中报告的方差解释比例。PCA的目标是在尽可能保留原始数据变异性的同时,减少描述数据所需的变量数量。请观察各主成分解释变异性的趋势。如果原始数据中存在相关性(趋势),则前几个主成分应解释大部分变异性,而最后几个主成分解释的变异性则较少。 如果原始数据中的变量几乎或完全不相关(正交),则每个主成分解释的方差量大致相同。在这种情况下,PCA无法用于降维,因此可能没有必要进行分析。这也可以通过分析生成的方差贡献率图来观察。

还有其他关于PCA的问题吗?

“主成分分析问答”页面提供了关于PCA的其他常见问题的解答