论文部分内容阅读
图像特征提取和分类方法是模式识别领域的研究热点课题。由于光照、表情、姿态和遮挡等因素的影响,如何提取鲁棒的图像特征成为一个关键问题。此外,近年来以稀疏表示分类为代表的表示分类方法受到广泛关注,并应用在各种图像分类任务中。然而稀疏表示分类存在三个缺陷:1)测试样本的表示系数中存在负数;2)需要干净的训练图像;3)直接使用所有的训练样本作为字典矩阵。这些缺陷导致稀疏表示分类在实际图像分类中的性能受限。本文针对鲁棒性特征提取、非负表示分类、鉴别性低秩表示和鉴别性字典学习进行研究,提出了一些新的方法。主要研究成果概括如下:(1)提出了一种基于二阶图像梯度方向的子空间学习方法。近年来的研究表明,相比于图像的一阶梯度信息,二阶梯度信息能更好描述图像的几何特性。受此启发,本文通过在二阶图像梯度方向特征上进行主成分分析,得到图像的紧凑性特征。此外由于协同表示分类方法具有计算高效的优点,因此用来作为分类器。在真实遮挡、合成遮挡、表情和光照变化情形下,提出的方法使用较少的训练样本就能取得较好的识别结果,并且优于一些基于深度神经网络的方法。(2)提出了一种基于类别相关残差约束的非负表示分类方法。最近提出的非负表示分类方法忽视了编码和分类阶段的联系,此外它缺少在表示系数上的正则项,容易导致测试样本的误分。本文在非负表示分类模型中引入类别相关残差约束项,增加不同类别训练样本在表示测试样本过程中的竞争性。本文提出的方法可以看作是在非负约束下协同表示分类和最近邻子空间分类器的结合。在人脸数据库、手写体数据库和大规模视觉分类数据集上的实验验证了本文方法的优势。(3)提出了一种基于低秩不相关和低秩投影的人脸识别方法。传统的低秩矩阵恢复方法主要关注恢复原始训练数据的低秩部分,而在分类阶段没有处理测试数据中可能存在的噪声。本文在低秩不相关方法中学习一个低秩投影矩阵,通过将测试数据投影到相应的潜在子空间来对其进行恢复。训练数据的低秩部分组成字典矩阵,然后对恢复后的测试数据进行分类。实验结果表明提出的方法能有效提升低秩不相关方法的分类性能。(4)提出了一种带有块对角结构的低秩表示方法。稀疏表示分类方法不能有效处理训练和测试图像同时受到污损的情形。为了使得到的表示系数矩阵具有鉴别性,在低秩表示模型中引入块对角结构保持项。同时引入字典学习过程以得到紧凑而又具有鉴别性的字典矩阵。利用增广拉格朗日乘子法对提出方法的目标函数进行优化,最后学习一个简单而有效的线性分类器对测试样本进行分类。在标准数据集上进行实验,结果表明本文提出的方法对图像中的光照变化、真实遮挡、随机像素破坏和人工遮挡等具有一定的鲁棒性。(5)提出了一种支持向量引导的局部约束字典学习方法。传统的鉴别性字典学习方法没有考虑字典原子的局部结构信息,另外他们仅利用单个决策准则来对测试样本分类。和传统方法在原始训练数据上定义图拉普拉斯矩阵不同,本文在支持向量引导的字典学习模型中引入原子的局部约束项。由于在优化过程中更新字典矩阵,因此在字典原子上定义的图拉普拉斯矩阵也随之更新。此外在分类阶段,本文设计了一种融合多分类SVM和重构误差的分类方法。实验结果表明在手工特征和深度特征上,本文方法均优于传统的字典学习方法。