目录:
1、什么是因子分析?
因子分析是一种数据简化技术。
即一种用来在众多变量中辨别、分析和归结出变量间的相互关系并用简单的变量(因子)来描述这种关系的数据分析方法
如考察中学生的语文、英语、历史,数学、物理、化学成绩;
于是可以提取出两个因子:文科因子和理科因子
2、因子分析的主要作用?
3、因子分析模型
A称为因子载荷矩阵
4、统计特征
因子载荷$a_{ij}$是第i个变量与第j个公共因子的相关系数;
共同度:变量$X_i$的共同度是因子载荷矩阵的第i行的元素的平方和,记为$h_i^2=\sum_{j=1}^{m}a_{ij}^2$;所有的公共因子和特殊因子对变量$X_i$的贡献为1,若$h_i^2$非常接近1,则因子分析的效果好,从原变量空间到公共因子空间的转化性质好;
贡献:因子载荷矩阵中各列元素的平方和$S_j=\sum_{i=1}^p a_{ij}^2$,称为Fj对所有的$X_i$的方差贡献和,衡量Fj的相对重要性;
5、因子载荷矩阵的估计方法
1)得到原始变量的相关系数矩阵;
2)主成分分析,得到特征值和特征向量;
3)确定因子个数(特征根大于1的;碎石原则:特征根从大到小排列,筛掉减小速度变缓的特征根);
4)载荷矩阵等于:特征向量*√(λ_i );
注:主成分分析法忽略了特殊因子。
6、因子旋转(正交变换)
为什么要因子旋转?
因子旋转方法
7、因子得分 当我们需要用因子再做分析时,就需要对因子进行测度,给出公共因子的值;
因子得分函数:把因子表示成原变量的线性组合;(得不到精确的值,只能估计)
方法:
8、因子分析步骤 1)选择分析的变量
因子分析的前提条件是观测变量间有较强的相关性,因为如果变量之间没有相关性或者相关性较小的话,他们不会有共享因子;
2)计算所选原始变量的相关系数矩阵
这也是判断所选变量是否有相关关系,如果没有,做因子分析是不恰当的;
3)提取公共因子
需要确定因子求解的方法和因子的数目。跟经验关系很大,一般方差小于1的因子贡献就很弱了,或者累计贡献率可以达到60%;
4)因子旋转
通过坐标变换使得原始变量和尽可能少的因子有密切关系,这样的因子实际意义更易解释;
5)计算因子得分
有了因子得分值,则可以在以后的分析(聚类分析、回归分析)中继续使用因子;
9、举例
注: 因子分析是十分主观的,得到的因子究竟有什么意义也都是凭借自己的先验知识才可以知道的,所以评价因子分析的质量也很主观了。
10、主成分分析和因子分析的区别
主成分分析是用原始变量的线性组合来表示新的综合变量,即主成分;
而因子分析是用潜在的假想变量和随机影响变量的线性组合来表示原始变量;因子分析除了公共因子外还有特殊因子。
最后:
若数据本身就十分的独立,就很难用少数的变量取表示原始变量,降维可能失败,数据越相关,降维效果越好,可用如下办法进行变量间的相关性检验: