论文部分内容阅读
随着互联网和多媒体技术的快速发展,图像数据不仅在人类的日常生活中以惊人的速度不断增长,并且在当前信息化社会的诸多领域中发挥重要作用。面对海量的图像数据,如何有效地组织、管理并拓展其潜在应用空间,是当前研究亟待解决的问题。尽管当前图像分类取得了长足的进展,由于海量图像的复杂多样性,以及图像的数字化存储和人类语义理解之间天然的“语义鸿沟”,高效可靠的图像分类依然充满挑战。近年来,越来越多的研究者意识到学习有效的图像特征表示已成为当前图像分类中最重要的环节,并将结构化信息作为特征学习的突破点之一。本文对图像分类中的特征学习方法开展研究,充分利用特征的二阶结构信息,学习更具语义判别性的特征表示。 本文首先对图像稀疏表示中编码特征之间的多重共线性进行了分析,提出了一种基于稀疏协方差矩阵编码的特征学习方法,通过协方差矩阵来刻画编码特征之间的二阶相关关系。由于过完备字典中视觉单词的独立性和特征编码密切相关,我们进一步提出了一种可适用于大规模图像分类的在线字典学习方法。其次,在分析传统二阶特征空间汇合的基础上,提出了一种基于二阶特征结构化汇合的图嵌入学习方法,通过矩阵扩张的方式,准确保持了原始二阶汇合特征的黎曼流形结构。基于黎曼流形的图嵌入核判别分析,不仅能够学习到紧致的低维特征表示,同时获得了较好的图像分类效果。最后,在基于正定矩阵稀疏编码与维度约减的基础上,提出了一种基于低维二阶特征汇合与字典学习的稀疏编码方法。与传统基于向量表示的维度约减方法相比,该方法能够保证低维特征的正定矩阵特性,不仅更加有利于字典学习,同时保持了原始二阶特征的流形结构信息。