1、主成分分析的概念
主成分分析(Principle Component Analysis,PCA)是将多个指标化为少数几个综合指标的一种统计分析方法,是一种降维的方式 将多个变量转化为几个少数主成分的方法...见图1,x1与x2之间是具有相关性的,将y1与x1之间的夹角为Θ,将y1与x1的相关性转换为y2与x2的相关性,采用数学处理方法进行处理,如:
y1=cosΘx1+sinΘx2
y2=-sinΘx1+cosΘx2...图1 主成分分析的几何解释
R语言的运用
假设x1和x2分别表示一个班级的男女的身高体重,做相关图以显示变量间的关系
>x1=c(147,171,175,159,155,152,158,154,164,168,166,159,164,177...3、主成分分析的目的
根据主成分分析的概念,我们可以了解到主成分分析的目的无非是想把难的问题简单化,用较少的变量去解释原数据中的大部分变异(此处变异可以理解为方差),期望能够将相关性很高的多数变量转化成互相独立的变量...0.9672073
x2 0.9672073 1.0000000
4、主成分分析的数学表达解释
主成分分析的成分yi和原来变量xi之间的关系:
y1=μ11x1+μ12x2+……μ1pxp= μ’1x