论文部分内容阅读
针对多视图数据,以往大多数研究工作往往关注多视图分类与聚类算法层面的研究,而对多视图特征选择与降维方法研究较少。随着近年来数据采集设备的迅速发展,高维多视图数据随处可见。针对高维的多视图数据,直接进行分类或聚类,往往很难达到特定应用要求的效果。由于不同视图间存在特征相关性,选择有效特征或学习公共低维表示能够提高学习模型的精度与效率,同时,有助于理解错综复杂的视图关系。因此,本文围绕“多视图特征选择与降维方法及其应用研究”这一主线来开展,针对研究中存在的问题,主要提出了以下四个创新方法:(1)一种联合局部与全局分析的多视图特征选择方法(Multiview feature selection method via joint local PAttern-Discrimination And global Label-relevance analysis,简称mPadal)。为了解决视图间有区别的特征选择问题(现有多视图特征选择方法仅选择与类别最相关的特征),我们引入视图间有区别的特征评价标准,提出了联合局部与全局分析的多视图特征选择方法nPadal。具体地,局部选择阶段从样本差异性角度出发来选取视图间有区别的特征,有助于提高视图间的互补性。而在全局选择阶段通过衡量所有特征的类别相关性来选择具有判别性的特征(能够较好地区分不同类别),对应问题被建模为带约束的二次规划问题。通过实验结果分析,所提方法nPadal在多角度行为识别数据集IXMAS中取得了比基准方法更出色的结果,同时也验证了通过mPadal选取的特征在视图间的分类任务中具有互补作用。(2)一种基于矩阵低秩的稀疏多视图特征选择方法(Multiview Rank Minimization-based Lasso,简称MRM-Lasso)。现有多视图特征选择方法仅从视图层考虑,通过给每个视图的所有样本赋予相同且固定的权重来衡量视图间的关系,然而,通常不同样本具有不同的判别能力。我们引入对样本的重要性衡量,提出一种基于矩阵低秩的多视图特征选择方法MRM-Lasso,通过矩阵低秩和稀疏假设来联合衡量视图层、样本层与特征层的重要性。具体地,我们首次将Lasso扩展应用到多视图稀疏特征选择任务中;并引入不同视图的示例权重,通过低秩假设来挖掘视图间示例的相关性。同时,采用基于交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的交替优化策略来解决样本与特征联合分析的优化问题。通过实验结果分析,MRM-Lasso在多角度行为识别数据集IXMAS中能够获得比已有基准方法更优异的分类表现。更重要的是,MRM-Lasso学得的示例权重能够探索多视图数据中不同视图与不同示例的判别性,对真实的复杂数据分析提供重要参考依据。(3)一种基于稀疏低秩表示的多视图缺失样本恢复方法(Sparse low-Rank Representation on multiview common Subspace,简称SRRS),以及三种具体的不完整多视图数据降维方法。现有的多视图数据降维方法处理视图样本缺失的多视图数据低效。为了解决这一问题,我们提出了缺失样本恢复方法SRRS。具体地,引入稀疏低秩学习来衡量视图内样本间的相关性,并通过公共子空间学习来捕获视图间样本的相关性,目的是尽可能地利用给定观测数据来恢复多视图缺失样本。为了验证所提方法SRRS的性能,在其基础上分别提出了基于图嵌入的不完整多视图子空间学习方法(Multiview subspace learning via Graph Embedding,简称SRRS-MGE)。基于结构稀疏的不完整多视图聚类方法(Multiview clustering via Structured Sparsity,简称SRRS-MSS)以及基于秩最小化的不完整多视图特征选择方法(Multiview feature selection via Rank Minimization,简称SRRS-MRM)。通过分别在多角度行为识别与多模态脑影像诊断两种典型应用上的实验验证,说明了SRRS解决不完整多视图降维问题的有效性。同时,也表明了联合使用稀疏与低秩学习的表现比单独使用稀疏学习或低秩学习更优异。(4)一种基于组结构的多视图在线子空间学习方法(Online Multiview subspacE Learning via group structure,简称OMEL).现有的多视图子空间学习方法处理具有时序关系的多视图数据低效。为了解决这一问题,我们提出基于组结构的多视图在线子空间学习方法OMEL。具体地,考虑到在线多视图数据的组结构会随着时间的推移而不断变化,我们引入组结构稀疏与组间隔约束,来要求学得的子空间表示与以往子空间表示保持原有的成组结构。同时,对于子空间模型在线更新,通过保存当前时刻的组信息与变换矩阵,避免对以往数据的重复处理。为了解决OMEL的优化问题,我们设计了有效的交替优化策略,并使用贪婪的坐标下降算法快速求解视图间公共的低维表示。最后,我们将所提方法应用于运动目标跟踪问题,通过在15个基准视频序列中的定性和定量的实验评估,充分说明了所提方法OMEL对解决目标形变、背景复杂、目标遮挡与光照变化等问题的有效性与鲁棒性。同时,实验结果表明在OMEL中学习变化的组结构有助于提升目标跟踪的精度。