论文部分内容阅读
随着智能手机、监控系统等设备的普及,现实生活中生成的数据越来越多,如何从这些高维数据中提取所需知识变的越来越重要。子空间学习可以有效分析和利用这些数据,并已被广泛应用于各种数据挖掘和计算机视觉任务中。然而传统的线性子空间学习是基于向量数据进行的,它在处理高阶张量时会产生非常高维的向量,从而导致大量的参数估计问题。多线性子空间学习是线性子空间学习的一种高阶泛化,其把高维张量直接映射到低维空间而不需对其进行向量化处理,这样可以提高运算效率,并保持数据原有的空间结构。但遗憾的是,目前关于多线性子空间学习的研究还不充分,如何进一步丰富多线性子空间学习理论,将其应用到不同的分类任务中,已成为模式识别领域的一个研究难点。基于单幅图像的模式识别方法易受到各种干扰和退化因素的影响,需要保证较高的成像质量和分辨率。而图像集数据因为包含了同一模式的不同表情、不同姿势、或不同光照下的多种图像数据,反映了同一模式的多种属性,有利于提升模式分类的效果。近年来,基于图像集的模式识别研究已成为一个新的研究热点和难点。图像集数据通常位于高维空间中,其往往含有大量冗余特征,且不同图像之间存在相关性,因此,学习图像集数据的低维嵌入对于提升分类效果、降低模型的复杂度至关重要。本文以子空间学习为主线,从高阶数据降维和图像集分类这两个方面展开研究,结合多秩多线性、流形学习、稀疏表示、局部化以及多核学习等技术,探讨了子空间学习在不同任务中的应用。本文的主要研究工作如下:(1)提出了多秩多线性典型相关分析方法(MRCCA)。目前已有的二向二维典型相关分析方法((2D)2CCA)假定投影矩阵为秩一矩阵,然而这种假设在现实场景下一般不成立。本文研究了一种更为常见的图像低维嵌入技术,即投影矩阵为一般的多秩矩阵。提出的MRCCA方法假设投影矩阵的秩为k,通过对投影矩阵进行奇异值分解,可以得到左右各k对变换向量。为了联合求解最优的变换向量,使用典型相关分析(CCA)的思想来建模,即要求变换后的数据在低维嵌入空间具有最大相关性。同时,通过理论分析,发现投影矩阵的秩k可以作为计算时间和识别精度之间的一个均衡参数,若秩变大,识别精度会提高,但相应的计算时间也会增加,反之亦然。在多个真实数据集上的实验结果,验证了所提方法的有效性。(2)提出了二向二维监督典型相关分析方法((2D)2SCCA)和多秩多线性监督典型相关分析方法(MSCCA)。经典的CCA和(2D)2CCA属于无监督算法,为了把样本的监督信息引入到这些方法中,提出了(2D)2SCCA算法。通过分析广义典型相关分析(GCCA)与(2D)2SCCA之间的关系,进一步提出了MSCCA算法。另外,本文证明了(2D)2SCCA属于MSCCA的一种特殊情况,同时MSCCA也可以看作是MRCCA的一种有监督的泛化扩展。在物体识别及人脸识别等任务中的大量实验结果表明,本文所提方法取得了良好的识别效果。(3)提出了二维局部保持典型相关分析(2DLPCCA)和二维稀疏保持典型相关分析方法(2DSPCCA)。二维典型相关分析(2DCCA)直接把图像矩阵作为输入,不需要对其进行向量化处理,这样可以有效保持图像的空间结构信息,降低计算成本并避免“维数灾难”问题。但是2DCCA是一种线性方法,其并不能有效地抽取图像数据的非线性特征。因此,本文首先基于局部化思想构建了一种二维子空间学习方法,称之为二维局部保持典型相关分析(2DLPCCA)。该方法基于2DCCA的一种等价形式,使用局部近邻信息来发现数据内部的非线性结构。此外,从相似性矩阵构造的角度出发,因为稀疏重构系数天然的具有判别能力,本文进一步提出了二维稀疏保持典型相关分析(2DSPCCA)框架。最后,在真实数据上面的实验结果验证了本文所提算法的有效性。(4)提出了多模型融合度量学习方法(MMFML)。传统的图像集分类方法通常使用单个模型来表示图像集,如使用线性子空间,凸包等,这些方法只能提取图像集中某一方面的判别信息,而忽略了其他的互补信息。基于此,提出了多模型融合度量学习算法(MMFML)。该方法使用均值向量、线性子空间以及协方差矩阵来联合表示图像集,从而可以利用互补的判别信息来提高分类的性能。由于这几种表示模型位于异相空间,为了减少它们之间的差异性以方便度量,首先利用不同的核函数把其映射到再生核希尔伯特空间,然后在高维空间学习最优的低维嵌入并得到三个双模型融合Modes,最后在低维共享子空间对图像集进行分类。在Honda、ETH-80和Youtube Celebrities三个数据集上的实验结果,验证了所提算法的有效性。