多视图特征选择与降维方法及其应用研究

被引量 : 0次 | 上传用户:gxmvsgxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多视图数据,以往大多数研究工作往往关注多视图分类与聚类算法层面的研究,而对多视图特征选择与降维方法研究较少。随着近年来数据采集设备的迅速发展,高维多视图数据随处可见。针对高维的多视图数据,直接进行分类或聚类,往往很难达到特定应用要求的效果。由于不同视图间存在特征相关性,选择有效特征或学习公共低维表示能够提高学习模型的精度与效率,同时,有助于理解错综复杂的视图关系。因此,本文围绕“多视图特征选择与降维方法及其应用研究”这一主线来开展,针对研究中存在的问题,主要提出了以下四个创新方法:(1)一种联合局部与全局分析的多视图特征选择方法(Multiview feature selection method via joint local PAttern-Discrimination And global Label-relevance analysis,简称mPadal)。为了解决视图间有区别的特征选择问题(现有多视图特征选择方法仅选择与类别最相关的特征),我们引入视图间有区别的特征评价标准,提出了联合局部与全局分析的多视图特征选择方法nPadal。具体地,局部选择阶段从样本差异性角度出发来选取视图间有区别的特征,有助于提高视图间的互补性。而在全局选择阶段通过衡量所有特征的类别相关性来选择具有判别性的特征(能够较好地区分不同类别),对应问题被建模为带约束的二次规划问题。通过实验结果分析,所提方法nPadal在多角度行为识别数据集IXMAS中取得了比基准方法更出色的结果,同时也验证了通过mPadal选取的特征在视图间的分类任务中具有互补作用。(2)一种基于矩阵低秩的稀疏多视图特征选择方法(Multiview Rank Minimization-based Lasso,简称MRM-Lasso)。现有多视图特征选择方法仅从视图层考虑,通过给每个视图的所有样本赋予相同且固定的权重来衡量视图间的关系,然而,通常不同样本具有不同的判别能力。我们引入对样本的重要性衡量,提出一种基于矩阵低秩的多视图特征选择方法MRM-Lasso,通过矩阵低秩和稀疏假设来联合衡量视图层、样本层与特征层的重要性。具体地,我们首次将Lasso扩展应用到多视图稀疏特征选择任务中;并引入不同视图的示例权重,通过低秩假设来挖掘视图间示例的相关性。同时,采用基于交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的交替优化策略来解决样本与特征联合分析的优化问题。通过实验结果分析,MRM-Lasso在多角度行为识别数据集IXMAS中能够获得比已有基准方法更优异的分类表现。更重要的是,MRM-Lasso学得的示例权重能够探索多视图数据中不同视图与不同示例的判别性,对真实的复杂数据分析提供重要参考依据。(3)一种基于稀疏低秩表示的多视图缺失样本恢复方法(Sparse low-Rank Representation on multiview common Subspace,简称SRRS),以及三种具体的不完整多视图数据降维方法。现有的多视图数据降维方法处理视图样本缺失的多视图数据低效。为了解决这一问题,我们提出了缺失样本恢复方法SRRS。具体地,引入稀疏低秩学习来衡量视图内样本间的相关性,并通过公共子空间学习来捕获视图间样本的相关性,目的是尽可能地利用给定观测数据来恢复多视图缺失样本。为了验证所提方法SRRS的性能,在其基础上分别提出了基于图嵌入的不完整多视图子空间学习方法(Multiview subspace learning via Graph Embedding,简称SRRS-MGE)。基于结构稀疏的不完整多视图聚类方法(Multiview clustering via Structured Sparsity,简称SRRS-MSS)以及基于秩最小化的不完整多视图特征选择方法(Multiview feature selection via Rank Minimization,简称SRRS-MRM)。通过分别在多角度行为识别与多模态脑影像诊断两种典型应用上的实验验证,说明了SRRS解决不完整多视图降维问题的有效性。同时,也表明了联合使用稀疏与低秩学习的表现比单独使用稀疏学习或低秩学习更优异。(4)一种基于组结构的多视图在线子空间学习方法(Online Multiview subspacE Learning via group structure,简称OMEL).现有的多视图子空间学习方法处理具有时序关系的多视图数据低效。为了解决这一问题,我们提出基于组结构的多视图在线子空间学习方法OMEL。具体地,考虑到在线多视图数据的组结构会随着时间的推移而不断变化,我们引入组结构稀疏与组间隔约束,来要求学得的子空间表示与以往子空间表示保持原有的成组结构。同时,对于子空间模型在线更新,通过保存当前时刻的组信息与变换矩阵,避免对以往数据的重复处理。为了解决OMEL的优化问题,我们设计了有效的交替优化策略,并使用贪婪的坐标下降算法快速求解视图间公共的低维表示。最后,我们将所提方法应用于运动目标跟踪问题,通过在15个基准视频序列中的定性和定量的实验评估,充分说明了所提方法OMEL对解决目标形变、背景复杂、目标遮挡与光照变化等问题的有效性与鲁棒性。同时,实验结果表明在OMEL中学习变化的组结构有助于提升目标跟踪的精度。
其他文献
<正>"中国刷业基地"——源潭镇,地处桐城、怀宁、潜山三县(市)交界,是潜山县东部的边陲城镇。走进源潭,宽阔的街道,整齐的厂区,繁忙的车流,一家连一家的酒店和超市,一座又一
城乡中小学音乐教育是素质教育的重要组成部分。我国64.3%人口在农村,农村中小学音乐教育的发展影响到素质教育落实,远远落后于城市,乡村教育是为农村发展提供后继人才的重要
中国电信自准备承接C网以来,摆在计费专业人面前的一个问题就是,作为收费依据的伴随着移动业务产生的漫游话单在省间如何交互,需要传递哪些信息,交互的流程,如何做到全国全网
随着信息技术的进一步应用,人们所面临的信息安全威胁日益增多。密码学作为解决信息安全问题的核心技术,也备受重视。如何在不同的应用环境中设计相对应的高安全密码学方案,
“郡县治,天下安”。县域经济是国民经济的基本单元,县域经济的强弱直接影响着国民经济的兴衰。我国的县域经济主要由农村经济和中小企业经济构成,县域经济是实现城乡一体化
目的:研究海燕的化学成分。方法:采用多种层析方法分离海燕乙醇提取物,根据理化性质和光谱数据分析鉴定化合物的结构。结果:分离鉴定了7个化合物,分别为:3-十八烷氧基-1,2丙
近年来,我国政务微信呈现井喷式增长,各级政府纷纷构建“指尖上的政府”。2013年8月,浙江省科技厅开通“创新浙江”科技类政务微信,但是由于政府本位的传统宣传模式与受众需
跨国互动是海外华人实现中国梦的助力器,中华民族认同是其动力源泉和先决条件,中华民族凝聚力的生成是其精神动力,三者共同构成了海外华人实现中国梦的动力机制。海外华人实现中
茶粕中含有12%左右的茶皂素,茶皂素不仅具有抗炎、杀菌等生物活性,还具有乳化、发泡、分散、润湿、稳泡等表面活性,是一种天然的性能优良的表面活性剂。本实验以江西高正生物
随着现代工业的发展,对配电系统的要求也越来越高,将现代电子技术、传感器技术、通讯技术、计算机及网络技术应用于传统的配电系统,促进配电系统由简单的控制向智能化的保护