估计:
设总体Z=(X,Y)~N(u,M),其中:
现在有如下的观测数据:
显然这个数据是缺失的,如果数据完整的话,那么这个参数估计起来很简单,用极大似然估计就OK,但是这样的数据不完整的情况下,用极大似然估计求参数是非常困难的...,现在我们知道EM算法对于缺失数据是非常有利的,现在我们用EM算法来求:
假设协方差矩阵
估计未知参数:
首先以u=[2,4]为例产生二元正态分布随机数,并将产生的随机数扣掉一部分数据,将扣掉的这一部分数据当成未知的缺失数据...有兴趣的同学可以用MATLAB这样的工具试一试,实验室的小伙伴试验后表示在u1,u2初始值都为1,迭代20次以后,最终都会收敛,u1=2.0016,u2=3,9580
3:高斯混合分布的定义;
混合模型是指随机变量...X的概率密度函数为下式:
这个式子表现的是这个混合模型有M个分支组成,每个分支的权值为ak,当每个分支的分布都是高斯分布时,则称混合分布为有M个分支的高斯混合分布(GMM)
现在进行假设:
设样本观测值为...则当y(i)=k时,表示第i个样本观测值x(i)是由高斯混合分布的第k个分支产生的。因此,引入变量y后,对数似然函数可以改写成为:
改写似然函数之后,我们就可以考虑用EM算法来对模型进行参数估计。