论文部分内容阅读
现实世界存在着大量可同时被多种高维数据信息所表示的对象。如每个因特网网页可被表示为其所含文档和指向它的超链接;一个人可被表示为与其相关的音频和视频内容;一幅图像可被它的不同类型的特征所表示(颜色、纹理和形状等)。该类数据常被称为多视图数据或者多表示数据。已有研究表明基于多视图数据学习能够通过视图间的相互促进可获得优于仅基于单视图数据学习的性能。为此,分析这些高维多视图数据以提取有用信息或知识,已成为当前模式识别、机器学习和数据挖掘领域的核心研究内容之一。典型相关分析(Canonical CorrelationAnalysis, CCA)是一种被广泛采用的处理和分析多视图数据的降维方法。本文主要基于CCA展开相应的研究,具体研究工作包括:(1)基于全监督全配对的多视图数据场景,针对CCA无法利用数据的监督信息,及其在面向分类时以组合特征作为分类任务的输入,提出了一种新的监督型降维方法——增强组合特征判别性的相关分析(Combined-Feature-Discriminability Enhanced Canonical CorrelationAnalysis,CECCA)。CECCA在CCA基础上,通过结合判别分析,实现对组合特征相关性与判别性的联合优化,以获得更适合分类的组合特征。另外,由于常用的特征组合方式有并行和串行两种,我们给出了相应的具体算法CECCA_P(CECCA_Parallelism)和CECCA_S(CECCA_Serialization)。(2)针对无监督半配对的多视图数据场景,为了克服CCA仅能利用有限的配对样本,而无法利用相对充裕的未配对样本的不足,提出了一种新的半配对CCA变异算法——邻域相关分析(Neighborhood Canonical Correlation Analysis,NeCA)。NeCA通过在CCA中引入视图间的邻域关系,实现了以多视图方式利用未配对样本的目标。并且,为了能同时以多视图方式和单视图方式利用未配对样本,我们提出两种正则化的NeCA版本:拉普拉斯正则化的邻域相关分析(Laplacian-Regularization of NeCA,LRNeCA)和主成分分析正则化的邻域相关分析(PCA-Regularization of NeCA,PRNeCA),以进一步提升NeCA的性能。(3)面向高、低分辨率人脸样本集所呈现的半配对半监督的实际场景,我们提出了一种用于低分辨率人脸识别的半配对半监督的框架算法。为了能够更有效的利用分布于不同特征空间的高、低分辨率人脸训练样本以及有限的标号样本,该算法分为构建一致空间(半配对学习)和在一致空间进一步的半监督学习两个阶段。进而通过在Yale、AR和Extended Yale B三种标准人脸数据集上执行实验,以测试所提算法的性能。(4)在无监督全配对的高、低分辨率人脸多视图场景下,针对低分辨率人脸识别问题,提出了空间正则化的典型相关分析(Spatial Regularization Canonical Correlation Analysis, SRCCA),该方法通过利用不同分辨率人脸的空间信息,获得优于CCA的识别性能。由于SRCCA算法涉及高、低两种不同分辨率类型的图像,所以与单分辨率人脸识别研究工作仅有一项正则化不同,SRCCA有两正则化项分别对应低分辨率人脸和高分辨率人脸。为此,我们进一步通过实验研究和分析了低分辨率和高分辨率人脸正则化项各自对低分辨率人脸识别性能的影响。