基于子空间的多视图学习理论和方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:cczzss1122334455
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息采集技术的迅猛发展,多视图数据在实际应用中随处可见。如何从多视图数据中提取有用信息成为目前模式识别领域的研究热点。不同视图反映了物体的不同特性,并且互为补充。因此,有效地融合不同视图信息,学习多视图数据潜在的低维表示,可以获得对物体的深刻认识,对于后续数据分析性能的改善、学习算法复杂度的缩减至关重要。本文从多视图共享子空间学习的角度入手,围绕多视图数据的特性如维度高、噪音大、各视图数据存在差异性、相关性等,开展完整多视图数据表示学习研究、不完整多视图数据表示学习研究。主要创新点包括:(1)针对目前大部分的多视图学习方法通常假设各视图数据相互独立、对最终语义表示的贡献是等同的,忽略各视图之间的关联性和差异性的问题,提出了一种有效的完整多视图数据表示学习方法(tRLMvC)。该方法由两部分组成:多视图数据的自表示张量学习和Tucker分解自表示张量。前者首先设计三阶张量表示原始多视图数据,然后利用具有循环卷积功能的t-product操作学习自表示张量,以便深入探索多视图数据间的相关性,包括同一视图内样本间的相关性,及不同视图间的关联性。后者引用Tucker分解以便在量化各视图的重要性的同时,获得数据的统一低维表示。迭代地执行这两部分,可以有效地增强自表示张量及其分解因子的学习效果。tRLMvC可以有效地量化各视图的重要性,同时从各视图中抽取适量信息识别多视图数据的统一低维表示。实验结果表明,充分考虑视图间的高阶相关性和差异性有利于提升多视图数据表示学习的性能。(2)针对部分视图数据存在实例缺失的问题,提出了一种有效的不完整跨视图哈希表示学习方法。其主要目的在于学习特定视图的哈希函数,在探究不完整视图间的关联性的同时,尽可能多地保留原始数据信息。具体来讲,该方法在共享空间内使用另一视图的数据对象,以线性组合的方式,重构当前视图的数据对象,其重构系数表示视图间的相关性。同时,为尽可能多地保留原始特征信息,对各视图的映射矩阵施加正交约束。引入量化策略将各视图在共享空间的隐表示转变成离散的哈希码。大量的跨视图检索实验验证了RUCMH方法可以有效处理不完整多视图数据。(3)针对多视图数据特征维度高,各视图数据特征表征能力不同,提出了一种多视图数据特征重要性和表示学习方法(WMvRL),可以有效处理完整多视图数据和不完整多视图数据。其主要学习目标在于量化视图内各特征的判别能力及各视图的贡献度,捕获多个视图和对象间的相关性,学习更精准的数据表示。具体来讲,WMvRL可以结合特征重要性度量,从多个异构特征空间中识别共享的低维潜在特征空间,重新表示观测样本。为了强化各视图中的信息特征,同时削弱噪声特征,WMvRL引入特征权重向量自动评估各特征的重要性。同时构建各视图的自表示矩阵为三阶张量,引入张量核范数(twist tensor nuclear norm,t-TNN)捕捉多视图数据间的高阶相关性。在自表示张量上应用Tucker分解,以便在确定共享的低维潜在空间的同时,量化各视图的贡献度。实验结果表明,同时量化不同特征的重要性、不同视图的贡献度有助于提升多视图数据表示学习的性能。
其他文献
目的:评估与分析冠心病(CHD)PCI(Percutaneous Transluminal Coronary Interruption)术后患者自我损耗现状;构建赋权小组干预方案并验证干预方案对CHD患者自我损耗、自我管理
近年来,随着食品行业对于食品质量要求的提升,食品加工行业逐步开始进行智能化转型,开始应用新型技术来解决生产过程中的产品检测问题;为了检测产线上不规则排布的冰棍的长度,设计了一种新型智能检测工位,并开发了配套算法;在算法开发中,融合了边缘检测及最小外廓拟合算法实现了连续非接触式的产品尺寸测量技术,并在7组238份样例的验证中,得到了低于1.1%的标准相对误差,达到了理想的检测目标。
当前学术界有关语言起源的解释或者观点,基本上都是推测或者假说。我们已经无法从源头上真正探究语言的起源,但是我们能够从婴儿的语言习得中一窥语言产生的奥秘。新生儿的第
近年来,人工智能技术的爆发式增长引发了知识产权学界的关注。在文学艺术领域,部分人工智能的生成物已经在外观上能够与人类创作的作品相媲美。在可以预见的将来,必然会有大量人工智能生成的文学艺术成果进入市场,如何对这些人工智能生成物进行保护、规制,成为了知识产权领域亟待解决的问题。目前,有学者提出狭义著作权、邻接权、反不正当竞争法等保护路径,甚至有学者提出人工智能生成物应进入公有领域的观点。在明确本文的人
经济形势的高速发展让企业对财务管理提出了更高的要求。在传统的财务式财务管理下,财务部门拘泥于事后的核算与分析,与企业的价值创造部门业务部门相对独立。信息系统的发展逐渐瓦解了这种状态,业务部门与财务部门的数据已经打通,但是现存ERP系统下的财务部门仍仅仅负责核算工作,并未有效深入业务前端,管理会计并未有效得到实施。随着《管理会计基本指引》中明确了业财融合的概念,很多企业均开始尝试实施业财融合。业财融
一任何国家,不论是有意识还是无意识,都具有其统治理念,并按照这种理念将其治下的民众纳入一定的序列体系。这就是“身份”或“法的身份”。身份与当时社会中存在的“阶级关
会议
随着信息采集技术的快速发展和计算机存储能力的提高,数据量增长迅速,与此同时,数据内部结构更加复杂,如何在规模庞大和结构复杂的数据当中挖掘出有用的信息为社会的生产生活创造价值是当今大数据时代面临的主要挑战。聚类分析是数据挖掘的基本工具,主要目的是根据样本之间的相似度将数据集划分为若干个子集。针对高维多视图数据集的聚类问题,基于子空间学习的方法由于其具有良好的聚类性能受到广泛关注。近年来,有许多基于子
随着油气行业的发展以及世界能源需求的不断增长、油气资源勘探开发的难度不断增加,深井、超深井以及非常规能源已经成为油气开发的重点方向。钻井作业中,井筒内各介质之间不
脲类化合物因其广泛的用途在许多领域有着重要的应用尤其在农药、医药领域,由于其是合成许多药物的重要中间体和原料被普遍应用于医药研究,并且因具有杀菌、除草等功效被普遍应用于农药生产行业。因此对脲类化合物的合成方法进行更深入的探索意义重大。本论文是在Se/CO体系的基础之上进行了更深一步的探究。在常压条件下,以硝基苯类化合物作为底物,与水、CO进行反应,在Se的催化下一步合成出二苯脲类化合物。相比高压反
对劳动的热爱与赞扬一直是我国优秀的文化传统,也是中华民族宝贵的精神财富。而随着当今互联网和新媒体的信息爆炸为我们的生活带来便捷的同时也在侵蚀着传统的劳动观念。有一部分人认为,社会自动化程度的日渐提高,已经不再需要勤奋劳动了。也有许多年轻人随着“网红”之风的盛行,甚至认为脚踏实地的劳动者是“没本事的人”。使得如何赚快钱,如何走捷径,想要靠“流量”快速变现的浮躁气息传播开来。在即将实现“两个一百年”奋