论文部分内容阅读
随着科学技术的进步和经济条件的发展,电子信息产品在现实生活中的应用越来越广泛,人们获取图像的手段也越来越丰富。但在实际应用中,获得的大量图像往往是高维的,并且还包含大量的冗余信息,使得对图像的后期处理变得非常困难,甚至导致“维数灾难”。因此,为了有效地提取高维图像中固有的信息,通常需要对其进行表达,即将高维空间中的数据在新的特征空间进行表达,然后再进行后期处理。在进行高维图像分析时,图像表达技术是处理高维图像的前提条件之一。 目前,图像表达方法已被广泛应用于模式识别与机器学习领域,并且取得了巨大的成功。但是,传统的图像表达算法存在一些缺陷,例如没有充分利用样本的几何结构信息、忽略样本中存在的类别信息等,致使传统的图像表达算法无法提取高维数据的本质结构信息。因此,为了对高维图像进行有效地分析,文中针对目前这些方法中存在的问题进行了深入研究,主要工作及创新点如下: (1)提出了一种基于图正则化的受限非负矩阵分解(GCNMF)算法,并应用于图像表达。传统的数据表达算法没有同时利用样本的几何流形结构信息与标记样本的类别信息,为了解决此类缺陷,GCNMF算法利用拉普拉斯图正则项来保持样本的几何流形结构信息,同时还将样本中存在的类别信息作为硬约束,使得同类的高维样本投影到低维空间中的同一点上。因此,相较于传统的NMF算法,GCNMF算法具有更强的鉴别性。在FERET、ORL、MNIST和OUTEX图像库上的实验结果表明,相对于其它图像表达算法,文中提出的GCNMF算法更能抓住数据固有的本质结构信息,提供更好的数据表达结果; (2)提出了一种多层流形与稀疏受限的非负矩阵分解(MMSNMF)算法,并应用于高光谱解混。在解混过程中,MMSNMF算法利用多层分解结构降低了陷入局部最小值的风险。同时,MMSNMF算法分别对丰度系数和端元增加拉普拉斯图正则化,使其保持高光谱图像的几何流形结构信息,而且还同时对丰度矩阵和端元矩阵增加L1/2稀疏正则项,充分利用了高光谱图像的稀疏性。在人工模拟数据集合和真实的Jasper高光谱图像集上的实验结果表明了文中提出MMSNMF算法的有效性; (3)提出了一种局部正则化的概念分解(LRCF)算法,并应用于图像表达。为了利用样本的局部结构信息,LRCF算法通过在概念分解的目标函数中增加局部学习正则项来考虑样本的几何流形结构信息和鉴别信息。同时,为了考虑标记样本的类别信息,提出了一种拓展的半监督学习算法,即局部正则化的受限概念分解(LRCCF)算法。与LRCF算法不同的是,LRCCF算法属于半监督学习算法,它将样本中存在的类别信息作为硬约束,使得原始空间中隶属于同一类的标记样本投影到低维空间中的同一点上。在公开图像库上的实验结果证明了文中所提LRCF和LRCCF算法的有效性; (4)提出了一种核稀疏概念编码(KSCC)算法,并应用于图像表达。稀疏概念编码(SCC)算法将样本的几何流形结构信息嵌入到基向量中,然后对每个样本进行稀疏表示。但是,SCC算法无法有效地处理高度非线性分布的数据。针对此缺陷,文中提出的KSCC算法通过核方法将原始特征数据映射到高维特征空间中,然后在高维核空间进行稀疏编码。因此,KSCC算法在进行图像表达时,不仅利用了样本的几何流形结构信息,还利用核方法来解决数据的线性不可分问题。在Yale、PIE和OUTEX图像库上的聚类实验结果表明文中提出的KSCC算法能有效地提高聚类的准确率和归一化互信息; (5)提出了一种受限的稀疏概念编码(CSCC)算法,并应用于图像表达。为了同时利用样本中存在的类别信息和几何流形结构信息,CSCC算法在图嵌入时将样本的类别信息作为硬约束,使得基向量中嵌入了样本的类别信息和几何流形结构信息。但是,在实际应用中,存在的数据往往是呈高度非线性分布的。为了克服此缺陷,文中在CSCC算法基础上,又提出了基于核的受限稀疏概念编码(KCSCC)算法。KCSCC算法在考虑了样本的几何流形结构信息和标记样本的类别信息的同时,还利用核化的方法来处理高度非线性分布的数据。在MNIST、PIE、Yale和OUTEX图像库上的实验结果表明,相较于其它的图像表达算法,CSCC算法和KCSCC算法能更好地抓住图像固有的结构信息,提供更好的语义表达。