信息不完全情形下的多视图学习方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:myxyj2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集技术的发展,在社会的诸多领域中,描述同一对象的特征可以来自不同的数据源,因此采集到的数据由多种特征表示组成。这类数据被称为多视图数据,其中每种表示对应数据的一个视图。多视图学习旨在结合多个视图的信息取得更好的学习效果。传统的有监督多视图学习以数据的标签及各视图的特征为输入,通常假设信息是完全的,即数据具有完整的标签信息及特征信息。然而,在实际应用中,经常面临信息不完全情形下的多视图学习问题,主要表现为标签不足或各视图的特征不完整,信息的缺失使得传统方法往往难以取得令人满意的学习效果。因此,从标签和特征两个维度,针对信息不完全情形下的多视图学习方法,本文开展了以下研究:1.针对数据标注有限且视图特征完整的半监督分类任务,提出了结合一致性与多样性的多视图半监督分类方法。通过设计概率链式损失,要求不同视图的分类器具有一致的预测结果,同时自动地区分了数据样本之间的不同重要性,减小了预测置信度较低的数据样本在训练模型时的权重,设计幂平均策略结合各视图的损失,在学习共有标签矩阵时,降低了损失较大的视图的影响。实验结果表明,通过同时利用预测一致性信息和样本之间、视图之间的多样性信息,该方法大多数情况下能取得了较对比方法更好的分类效果。2.针对数据标注有限且视图特征整体缺失的半监督分类任务,提出了缺失多视图半监督分类方法。基于各视图构造的不完全图矩阵,对每个视图存在的样本进行分类,同时度量各个视图的分类结果与类别指示向量之间的差异,学习跨视图的概率标签矩阵。与传统研究不同,该方法尝试采用全新的基于图的方法进行不完全多视图半监督分类。此外,通过设计基于锚点策略的相似性计算方法以及高效的迭代求解方式,算法的计算复杂度显著降低。所提方法在多个数据集上以及文本分类应用中取得了优于对比方法的分类结果。3.针对数据无标注且视图特征整体缺失的聚类任务,本文进行了两种探索。基于不完全图矩阵的多视图谱聚类方法以各视图独立构造的不完全图矩阵为输入,同时进行图矩阵补全和表示学习来更好地挖掘数据的聚类信息,通过引入视图独有的表示矩阵及使用p次幂结合策略,更好地利用了视图间的多样性信息。基于各视图的不完全图矩阵,联合表示学习和聚类框架同时学习视图独有的表示矩阵和视图共有的概率类别指示矩阵,使表示学习考虑聚类的需求。此框架可以将传统基于图的表示学习方法改造为针对不完全多视图数据的聚类方法,建立了单视图表示学习与不完全多视图聚类之间的联系。4.针对数据无标注且视图特征任意缺失的聚类任务,提出了基于不完整特征的多视图低秩子空间聚类方法。通过自表达重构,该方法同时补全缺失的特征及学习视图独有的自表达矩阵,通过引入跨视图的自表达矩阵,以及设计基于互补性信息的视图权重学习机制,不同视图的信息可以合理地交互,通过添加低秩约束,更好地挖掘自表达矩阵的本征结构,同时降低了求解算法的计算复杂度。此外,本文介绍了传统多视图子空间聚类方法的改造方式,使之能处理视图特征任意缺失的多视图数据。多个数据集上的实验结果表明,所提方法在大多数情况下能取得较对比方法更优或相当的聚类结果。开展信息不完全情形下的多视图学习方法研究可以丰富完善机器学习领域的理论方法,并为实际应用中的数据分析处理提供相应的方法支撑。
其他文献
身处充满变化和不确定性的环境中,团队主管经常会经历权力损失,即主管掌握的重要资源遭到损失,或成员对主管权力的合法性认可下降。这是主管乃至整个团队都经常面对的考验。然而,现有研究缺少对“权力损失”的足够关注,且少量的相关研究仅停留在权力损失对个体产生的各种负面影响上,缺少个体主动应对权力损失并重建权力的研究。另外,现有大多数研究仍秉持结构主义的权力观,静态地研究权力的影响规律,缺少从动态视角对权力有
学位
近年来,越来越多的实体企业热衷于购买理财产品、买卖有价证券、投资房地产、发放委托贷款、通过设立小额贷款公司或财务公司参与影子银行业务。这一非金融企业对金融市场的参与度日益增加、企业资金不断涌入金融领域的现象被称为企业“金融化”。由于金融投资的收益率远高于实体投资,企业配置金融资产能够在短期内改善企业的财务状况。然而从长期来看,对金融资产的过度投资容易挤出主营业务发展所需要的资源,阻碍企业竞争力的构
学位
2020年4月24号,中国行星探测工程“天问系列”正式启动,2020年7月31号,北斗全球卫星导航系统正式向全世界提供服务,我国太空活动加速发展。航天器的姿态控制和信息处理需要大量的集成电路系统。太空中有很多宇宙粒子,这些太空粒子对航天器内的集成电路造成不同程度的影响甚至破坏,因此我国空间技术对抗辐射高性能集成电路提出迫切要求。随着科学技术的进步,半导体器件尺寸等比例缩小,单位面积上集成的器件数目
学位
Ir是一种熔点高且氧渗透率极低的贵金属材料,已应用于航天器推进系统高温部件的热防护,在超高温(>1800℃)条件下较传统Si系超高温陶瓷有独特优势。但受制于Ir在非平衡环境下极高的热响应,其在高超声速飞行器热防护领域的应用受到了限制。针对此问题,本文通过表面合金化改性制备出Ir-X合金层,有效降低了Ir涂层的催化系数,并提高了涂层发射率,改善了涂层非平衡环境下的烧蚀性能。围绕这一目标,论文从改性元
学位
多输入多输出(MIMO)雷达,基于发射分集技术可获得远大于其物理阵元数的系统自由度(DOFs),在成像方面相较于传统雷达成像技术具有独特的优势。正交发射波形集是MIMO雷达成像应用的重要基础。正交频分复用(OFDM)是现代通信中常用的一种多载频传输技术。利用OFDM信号多子载频间天然的正交特性,可以实现MIMO雷达理想的正交发射,从而有效避免多个发射通道间的串扰,最大程度地提高MIMO雷达系统的成
学位
精密、可靠和实时性好的动对动相对定位技术对于航天器空间交会对接、飞机协同加油、车辆智能交通和舰载机着舰引导等应用至关重要。全球卫星导航系统(Global Navigation Satellite System,GNSS)以其全球覆盖性、全天候可用性和较好的长期精度,是目前实现动对动相对定位的主要手段。然而,GNSS导航信号较为脆弱,容易受到遮挡和干扰,并且GNSS接收机的采样率一般较低。惯性导航系
学位
后摩尔时代,一方面,工艺尺寸的继续缩小变得越来越困难,另一方面,传统处理器结构的创新也面临诸多瓶颈。为了继续提高数据处理的性能来满足日益增长的计算需求,一些面向特定领域的专用计算结构被提出。基于伊辛模型的CMOS型伊辛架构将组合优化问题映射为伊辛模型,通过伊辛模型的基态搜索过程高效求解组合优化问题。当前CMOS型伊辛架构的研究聚焦于降低自旋更新电路的硬件开销,提高自旋的集成能力,使其支持大规模的现
学位
中低速磁浮列车作为一种新型的城市轨道交通工具,越来越得到公众的关注和认可。北京和长沙已建立示范线并开通运营,广东清远和湖南凤凰也正在建设中低速磁浮旅游线。悬浮系统作为中低速磁浮列车的关键系统之一,其安全性和可靠性对中低速磁浮列车的运行具有十分重要的影响。其中,故障预测与健康管理(Prognostic and Health Management,PHM)技术作为一种提高系统运行安全的有效手段,受到了
学位
提升无人平台的自主能力是未来智能化无人作战亟需解决的关键问题。无人平台自主能力的核心之一是其在不确定环境中自主学习和规划的能力。然而,智能体学习和规划过程中面临着两大难题:环境的不确定和问题规模的增大。环境模型不准确、行动效果不确定、环境动态变化等不确定因素,以及随着问题规模的增大导致状态空间大、动作空间大和任务周期长等特点,为智能体自主学习和规划带来了巨大的挑战。针对上述问题,本文以马尔科夫决策
学位
单目三维人体姿态估计是指从单台相机拍摄的单张彩色人物图像或者图像序列中估计出人体若干关键点在三维空间中的坐标的问题。人体姿态估计能提供关于人体运动和姿态的丰富几何信息,因此在人机交互、机器人、人类行为分析、游戏设计、虚拟现实、视觉监控等领域有着广泛的应用。尽管诸多研究人员在此领域投入了大量努力,单目三维人体姿态估计仍是一个十分具有挑战性的研究问题。其主要难点在于人体姿态的高自由度、图片深度信息的缺
学位