论文部分内容阅读
有限混合模型是用于分析复杂问题的一个有效的建模工具。在诸多的混合模型中,混合高斯模型的应用更为广泛,尤其是在图像处理、人脸识别、通信和信号处理等。理论及数值试验充分证明:混合高斯分布模型能够逼近任何一个光滑分布,而对该模型参数的有效估计是准确分析、模拟复杂问题的必要前提。最常用的点估计是矩估计和极大似然估计。在混合高斯模型的研究中,最初是用矩估计法解决两分支的混合高斯模型参数估计。对两分支以上的混合模型而言,矩估计法难以得到满意的解决方法。而极大似然估计可以对多分支混合高斯模型的参数作出估计,EM算法是求解极大似然估计的常用方法。EM算法自从提出,就已成为一种非常流行地处理不完全数据的极大似然估计的方法。恰好我们经常处理的样本数据集通常可看作是不完全数据,进而EM算法就为混合高斯模型的参数估计提供了一种标准框架。但是EM算法是一种容易陷入局部最优值的迭代算法,收敛速度慢,对初始值依赖性较强,使得最后的参数估计结果不精确。为了能够得到混合高斯模型参数的优化估计,本文将具有全局收敛性能的遗传算法和粒子群算法结合于EM算法框架中来克服EM算法自身的缺点。遗传算法具有很强的全局搜索能力,但是由于其在初始值设定以及变异等操作中的随机性,使得搜索结果会受到一些随机因素的影响。因此本文首先将粒子群算法应用于遗传算法的初始种群选取以及变异操作上来改进遗传算法,将改进的遗传算法与EM算法框架结合。一方面降低了EM算法对初始值的依赖性,另一方面也有效地提高了收敛速度及混合高斯模型参数估计值的精度。通常我们都是在混合分支数已知的情况下对各分支参数进行估计,但是对大多数复杂问题的模拟中,混合高斯模型都是分支数未知的。为了得到合理的分支数,本文将最小信息长度准则框架与改进的EM算法(PSOGA-EM算法)结合。不仅优化了各分支的参数估计结果,同时也比较准确地估计出了混合高斯模型的分支数,最后通过两组数值试验证实了本文所提方法的可行性和稳定性。