论文部分内容阅读
作为计算机视觉和模式识别领域的一个热点课题,图像识别被应用于公共安全、国防军事、农业和日常生活等许多方面。基于稀疏表示的分类方法由于其所具有的简单性和有效性在近年获得了广泛的关注,并且被成功地应用到了计算机视觉和图像处理的一列系问题当中。在基于稀疏表示分类的框架中,字典对稀疏编码和分类的性能起着至关重要的作用。从训练样本中学习一个具有判别性的字典具有重要的意义。目前字典学习方法可分为非监督字典学习和监督字典学习两类。尽管非监督字典学习方法取得了不错的效果,但是监督字典学习被认为能够在识别任务中取得更好的结果。监督字典学习方法大致可分为两个方向。第一个方向在目标函数中加入某些判别项使得得到的表示更加具有判别性。第二个方向根据训练样本的标签信息来学习一个结构化字典。基于结构化字典学习的原理,本文主要从以下两个方面开展研究工作: (1)结合结构化稀疏表示和结构化字典学习的思想,本文提出了一种新的Block-KSVD算法来学习得到一个具有块结构的字典。具体地,在稀疏编码阶段,Block-KSVD不仅将来自同一个类别的全部训练样本来联合进行结构化稀疏编码,并且假设它们具有相同的块结构表示。本文提出了并行的块正交匹配追踪算法(SB-OMP)来完成样本的结构化稀疏编码。在字典更新阶段,Block-KSVD算法基于奇异值分解技术来逐块地更新字典原子和其对应的稀疏编码。由于采用了奇异值分解技术,本文方法能够自然地学习到块内一致性为零的块结构化字典。本文还提出了Discriminative BlockK-SVD(DB-KSVD)算法来同时学习得到块结构化字典和一个线性分类器。 (2)在Block-KSVD算法的基础上,本文进一步提出了Supervised Block-KSVD(SB-KSVD)算法来学习一个具有块结构的字典。在稀疏编码阶段,SB-KSVD不仅假设同一个类别的训练样本具有相同的块结构表示,并且限定对应类别的子字典必须在表示这个类别的训练样本时做出贡献。本文提出了一种监督的并行块正交匹配追踪算法(SSB-OMP)算法来完成结构化稀疏编码。在字典更新阶段,SB-KSVD找出对应类别训练样本的错误矩阵执行奇异值分解来逐块地更新某个类别的字典原子和对应的稀疏编码。由SB-KSVD学习得到的字典可以保证各个类别的子字典对同一个类别的训练样本具有良好的表示能力,这进一步提高了字典的判别性。 本文在两个公共的人脸数据库AR和Extend YaleB以及手写数字数据库Mnist上进行了大量实验来验证所提出算法的有效性,并且与基于稀疏表示的分类方法SRC、K-SVD算法以及其它的一些经典的字典学习算法进行了性能比较。实验结果表明本文提出的字典学习方法能取得了更好的识别效果。