论文部分内容阅读
本文以统计理论为基础,研究两个方面的内容:(a)对有限混合模型的有关议题进行了较为系统的研究;(b)结合人脸识别问题,研究了二维主成分分析的非线性扩展。在统计模式识别中,有限混合模型是一种正式的(基于模型的)无监督聚类方法,而基于二维主成分分析的方法的核心问题是研究无监督的特征提取。它们都属于统计模式识别中无监督的范畴,无监督方法的特点是直接利用没有类别标记的样本进行学习或特征提取。本文的主要研究内容及创新如下: 研究一族重尾分布—多维t分布的有限混合模型。我们常用Gauss混合分布来对多维数据集进行聚类或拟合,但在许多应用中,Gauss分布的尾部比需要的要轻,而且分量均值和方差矩阵的估计会受到关于分量的非典型观测样本的严重影响。作为一种鲁棒的替代方法,采用多维t混合分布建模是一种标准的选择。此外,多维数据集常不可避免地有丢失值发生。我们基于极大似然估计,利用期望最大化算法导出了有数据随机丢失时多维t混合分布的拟合框架。这里,期望最大化算法既用来处理丢失值又用来估计模型参数。获得的结果可用于广泛的无监督聚类及有监督判别问题。 对有限混合模型中分量数目g的估计进行研究。这是有限混合模型拟合的一个重要议题,一些经典的混合模型拟合方法(比如极大似然方法、Bayes方法)都是在固定g的情况下进行学习。然而有时g的值不可得知,我们必须从获得的数据集对其(及模型其它参数)进行推断。这是模型选择的问题,也是用期望最大化算法拟合有限混合模型的主要困难,因为期望最大化算法本身不能估计g;相反,它需要事先指定g才能进行模型其它参数的估计。为了解决这个问题,我们提出了一种无监督学习有限混合模型的逐步分裂融合期望最大化算法。这里的无监督有三层含义:(a)没有/不需利用样本的类别信息;(b)能够自动估计g;(c)不需要仔细的初始化。该算法交替分裂和融合混合分量,从而同时估计g及模型其它参数。此外,用来有效选择分裂或融合操作的两个新准则也被提出。实验结果显示了该算法的有效性。 研究概率二维主成分分析及其混合模型,及它们在人脸识别中的应用。主成分分析(或特征脸)是一种成功的子空间人脸识别方法,并且已成为事实上的人脸识别领域其它方法识别性能的评测基准。然而,几乎所有基于特征脸的人脸识别方法,都是在高维的图像空间进行,这使得寻找脸空间的计算不易。最近提出的二维主成分分析直接基于原始图像矩阵计算,摆脱了特征脸方法从图像矩阵向向量转换的限制,被证明了是一种高效的人脸识别方法。我们考虑一个新的图像空间—图像矩阵的行所在的