论文部分内容阅读
高斯混合模型作为一种重要的概率模型已被广泛地应用于模式识别、图像分析、信息处理和数据挖掘等诸多领域。在高斯分量个数已知的情况下,许多学者对高斯混合模型的参数估计问题进行了深入地理论研究,并建立了有效的迭代型学习算法,即EM算法。然而在许多实际应用中,高斯分量个数是未知的或难于准确估计的。这时如何既能估计出模型中分量个数又能对混合模型中的参数进行有效的估计则成为一个非常重要而困难的问题。显然,该问题的难点主要在于高斯分量个数的估计上,因为错误的高斯分量个数必然导致高斯混合模型的参数估计或学习算法收敛到一个错误结果。由于混合模型的分量个数反映了其规模或尺度,因此分量个数的选择问题被称为模型选择问题。实际上,许多学者对于模型选择问题进行了很多有益的探索。一种传统的模型选择方法就是基于某种信息或统计准则来进行判别,但这些准则常常出现错误,并且需要大批量的参数估计而耗费大量的时间。近年来,针对高斯混合模型的模型选择和参数估计问题,人们从统计学习的角度提出了自适应模型选择的研究思路,即在参数学习过程中让高斯分量个数自动地适应数据结构和特点,达到最后正确匹配的结果。自适应模型选择可通过尺度(分量个数)增长型、压缩型和动态变化型学习方式来实现。
贝叶斯阴阳(Bayesian Ying—Yang,简称BYY)和谐学习系统与理论为统计学习提供了一个统一的学习理论和框架。它不仅可以很好地解释一些已有的学习算法,并能够产生出一些新的学习系统和机制。针对高斯混合模型的建模问题,已经建立了基于BYY的和谐学习模型和准则。在此基础上,本文对于分量和谐匹配进行了深入的分析,首先提出了尺度增长EM算法来解决高斯混合模型的模型选择和参数估计问题。另一方面,由于动态模型选择方法具有更多的灵活性,我们对于基于BYY和谐学习的动态模型选择算法进行了深入的探索并建立了有效的学习算法。在BYY和谐学习准则下,我们建立了动态学习的几种不同的分裂与合并方法。根据这些方法,我们能够使得在学习过程中混合模型中没有与真实数据分量相匹配的参数分量进行合理分裂或合并,最后达到正确的模型选择和有效地参数估计。
通过实验和分析,我们发现所提出的两种统计学习算法能够自适应地解决高斯混合模型针对一组数据的模型选择问题,并且其性能是可靠和稳定的。另外,我们将这些算法成功地应用到基于高斯混合模型的直线检测、彩色图像分割、纹理分割与分类等领域,其性能都优于传统的方法。通过实验发现,自适应模型选择功能能够自动地确定实际数据中的分量或类别个数,提高了所建模型的准确性和精度,大大提高了数据建模和实际应用的效果。实验结果表明,本文所提出的自适应模型选择算法在效率和稳定性方面均优于传统的统计学习算法。