|
主成分分析和因子分析都是反映了数据降维的思想。通过降维将相关性高的变量聚在一起,从而减少需要分析的变量的数量,进而减少问题分析的复杂性。
两者的区别是在降维目的上有些差异。
主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的。即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。
因子分析是通过研究变量之间是否具有相关关系,寻找潜在的、起支配作用的因子,把原始变量转变为新的因子,这些因子之间的相关性较低,而因子内部的变量相关程度较高。
降维之后,可以进一步做聚类或回归分析。
|
|
共 6 个关于本帖的回复 最后回复于 2020-2-7 12:11