论文部分内容阅读
非负矩阵分解(Nonnegative Matrix Factorization,NMF)是近年来提出的一种新的大规模数据降维的方法;非负矩阵分解应用很广,如人脸识别,医学基因检测,文本聚类分析,模式识别以及盲源信号分离等。非负矩阵分解问题实质上是将非负矩阵近似为非负基矩阵W与非负系数矩阵H的乘积。这样数据矩阵V的列向量等于基矩阵W列向量的非负线性组合,这种基于基向量非负线性组合的表示方法反映了极为直观的“局部构成整体”的语义解释。将“局部构成整体”的思想用于一般的数据矩阵上,得到所谓的半非负矩阵分解(Semi NMF),该分解保留了W与H的可解释性。 本文第一个主要工作是:从线性互补问题出发,基于不动点方程投影梯度提出了三个非负矩阵分解算法。文中先把欧氏距离函数转换为若干个非负最小二乘问题,再利用KKT条件,将非负最小二乘问题转换为一个线性互补问题,然后基于线性互补问题提出不动点方程的梯度投影算法。分别依据最速下降法和最小梯度法确定搜索步长。文中证明了这两个非负矩阵分解算法的收敛性,并通过ORL人脸数据库进行数值实验,结果表明这三个算法在逼近误差上均优于Lee和Seung的乘性迭代算法,而在人脸识别的准确率与乘性迭代算法的结果相当。 本文的第二个主要工作是:对半非负矩阵分解,提出了基于罚函数的Semi-Class半非负矩阵分解算法。此外,结合最速下降法与最小梯度法搜索步长,进一步提出了基于不动点方程的两个半非负矩阵分解算法。文中证明了这三种算法的收敛性,并将这三种半非负矩阵分解算法应用于医疗检测报告中,同时将最大元准则和最近子空间准则分别作为分类的标准。数值实验表明,本文提出的三个半非负矩阵分解算法在这两个分类标准下的医学诊断准确率均优于Chris Ding的Semi-NMF算法。