论文部分内容阅读
随着信息技术的快速发展,大数据正深刻地改变着人们的思维和生活方式,并且促进了社会的进步和经济的发展。然而,大数据也伴随着复杂度高、数据过量和信息冗余等问题。因此,如何对数据进行有效地分析并从中学习具有鲁棒性和判别性的数据表示是一个极具挑战性的问题。为了解决这一问题,基于稀疏表示的特征学习算法应运而生。稀疏表示理论是模式识别领域非常重要的研究话题,因其出色的数据表示和特征提取能力,近年来受到了众多研究者的密切关注。从数据有无标签的角度出发,现有稀疏表示算法主要分为两大类:有监督的和无监督的稀疏表示。其中,基于监督学习的图像分类和基于无监督学习的图像聚类是稀疏表示的主流应用方向。为了学习具有判别性的数据表示以及不同视图之间共享的一致性特征,研究者们提出了许多基于稀疏表示的图像分类和多视图子空间聚类算法,然而这些算法仍然存在以下几点问题:1仅使用l1/l0-范数的稀疏表示不能有效去除样本中大面积的连续块遮挡噪声;2在非深度模型中没有借鉴深度学习的特点来同时探索数据的非线性和线性结构;3在多视图子空间聚类任务中无法自适应地削弱聚类结构模糊的视图对公共子空间学习带来的影响;4样本噪声仅服从单种分布的假设使得模型对混合噪声的鲁棒性较弱;5对表示的结构化设计不合理;6分类器和数据表示分离的学习方式无法保证所学表示对于分类来说是最优的。为了解决以上问题,本文主要针对基于稀疏表示的图像分类和多视图子空间聚类进行研究并提出一系列改进算法。具体地,可以从固定字典、单合成字典学习和字典对学习三个方面对本文所提算法进行概括。(1)基于固定字典的稀疏表示:1为了提升基于l1-范数的稀疏表示对连续块遮挡噪声的鲁棒性,提出一种基于核范数矩阵回归的稀疏正则化人脸识别算法。相关研究表明,连续性噪声通常具有低秩的特性。通过最小化二维误差矩阵的核范数,可以充分利用误差的低秩结构信息,从而实现分离噪声的目的。受此启发,同时考虑到l1-范数的稀疏特性有助于增强数据表示的判别能力,该算法将基于核范数的矩阵回归和基于l1-范数的稀疏表示融合在同一个模型中,能够同时探索误差的二维低秩特性和表示的稀疏性。实验表明,这种融合可以有效地缓解连续块遮挡噪声对人脸识别的负面影响。2为了继承深度学习中深度特征级联和非线性特征变换的优点,提出了一种深度交替级联的表示学习算法。该算法利用基于重构误差的Soft Max向量将稀疏表示和协同表示进行交替地级联,有效地将表示的稀疏性和协同性集成到统一的模型中。此外,该算法能够充分挖掘数据中潜在的判别结构信息,可以看作是单层稀疏编码的深度拓展。实验表明,随着级联层数的增加,所提深层表示学习模型的分类精度明显优于传统的单层模型。(2)基于单合成字典学习的稀疏表示:3为了快速且精准地对大规模数据进行聚类,提出了一种快速自引导的多视图子空间聚类算法。该算法以公共锚点学习为研究基线,首先使用局部的每一个视图轮流地学习不同视图共享的一致性表示,然后利用对所有视图进行级联得到的全局特征来学习包含所有判别信息的全局数据表示。为了将全局学习和局部学习进行连接,该算法利用l2,1-范数来学习行稀疏的投影矩阵,使得模型能够自适应地从全局判别信息中选择最有用的特征来引导局部公共子空间的学习。通过这种全局监督局部的学习方式,该算法能够有效地抑制在局部一致性表示学习过程中那些聚类结构模糊的、信息冗余的视图。实验结果表明,该算法与最新的基于锚点学习和深度学习的多视图子空间聚类算法相比,能够取得更高的聚类精度和聚类效率。4为了学习更加合理的结构化数据表示并且提升字典学习对混合噪声的鲁棒性,提出了一种用于人脸识别的基于松弛块对角表示的噪声鲁棒字典学习算法。该算法以低秩矩阵恢复理论为基础,对字典学习的重构误差同时施加l1-范数和F-范数约束,使得模型能够从污染样本中同时分离出服从拉普拉斯分布和高斯分布的噪声。此外,该算法对严格“0-1”块对角结构逐类地引入基于l2,1-范数的松弛项,使得模型能够更加松弛地学习块对角结构化的数据表示,并且能够有效保持类内表示的相似性。实验表明,集成松弛块对角表示学习和基于低秩表示的混合噪声移除于一体,能够有效提高复杂噪声污染下人脸识别的性能。(3)基于字典对学习的稀疏表示:5为了同时学习结构化的合成字典和解析字典,提出一种基于局部约束松弛块对角表示的字典对学习算法。该算法在严格“0-1”块对角结构的基础上引入基于哈达玛积的松弛块对角表示学习项,使得模型能够更加松弛、高效地学习结构化的数据表示,同时能够保证合成字典原子的多样性。此外,为了避免表示学习的过程过于松弛,该算法引入局部保持项来促使相似的样本有着相似的解析编码。实验表明,基于哈达玛积的松弛学习项和对解析编码的局部保持项是互补的,它们均有助于提升模型的分类性能。6为了学习更适用于分类的结构化表示,提出一种基于尺度约束自适应结构化表示的字典对学习算法。该算法首先对表示系数施加非负约束,然后利用字典原子二值标签矩阵将训练样本的表示系数线性地投影到训练样本所对应的二值标签矩阵。这样一来,该算法能够在“和为1”的尺度约束下自适应地学习到块对角结构化的数据表示。因为字典的标签矩阵可直接用作线性分类器,所以该算法仅利用一个正则项就可以同时实现结构化表示学习和线性分类器学习的目的,显著降低了模型优化和参数调节的复杂度。实验表明,和最新的字典学习甚至是某些深度学习算法相比,该算法可以达到更高的分类精度。