面向紧致表示的多视角学习

来源 :天津大学 | 被引量 : 0次 | 上传用户：kniba98

【摘要】

：

【作者】

：

刘叶青

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2019年01期

【关键词】

：

多视角表示学习度量学习嵌套自编码器紧致表示

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的发展,真实数据往往具有多视角的特性,即同一对象数据由多个模态或多个数据源构成。例如,对同一物体可以由其图片展示其特征,也可由语言描述其属性信息;一张自然图像可从颜色、形状、纹理等不同角度分别提取信息,由其共同表示。由于机器学习任务很大程度上依赖于数据的特征表示,而表示学习方法可以减少人工设计的难度和随意性,自动地从数据中学习出高效的表征。无论是监督还是无监督的任务,借助多视角数据丰富的特征进行紧致的统一表示学习,是提升数据分析的重要研究方向。本文以多视角数据的紧致表示学习为研究目标,在监督和无监督的任务场景下,研究了如何有效利用一致性与互补性来融合多源信息,具体如下:（1）多度量协同的多视角表示学习方法。在监督学习情景下,本文提出了一种基于度量学习的多视角特征融合方法。该方法通过改进的线性判别分析方法为每个视角学习特定的度量函数,保持其独特性,同时借助希尔伯特-施密特独立性准则最大化不同视角间的相关性,实现了在核空间中各个特征表示的一致性。实验结果表明了所学表示在分类任务上可以取得较好的性能。（2）基于嵌套自编码器的多视角表示学习方法。在无监督学习情景下,本文提出了一种嵌套的自编码网络模型。该模型一方面利用内层的自编码器为每个视角的数据提取各自的特征表示。另一方面不同于一般方法将其映射到共同的子空间中,外层的自编码器在共同的隐表示输入下,重构出各个视角的特征,使得隐表示灵活地平衡了多视角的一致性与互补性。实验验证了所学表示在分类与聚类任务上具有优越的性能。

其他文献

基于多光谱成像的在体组织检测方法研究

光谱成像技术能够同时获取在体组织的结构与谱域信息,具有分辨率高、成像范围广以及信息丰富等优势,在生物医学领域应用广泛。在在体组织检测及成像中,结构紧凑、成像速度快、低成本的成像系统是扩展光谱成像技术应用的关键。本文搭建了基于窄带滤光片以及光谱重构方法的多光谱成像系统,并通过蒙特卡洛模拟、仿体实验以及在体组织实验对其可行性和有效性进行了综合研究。首先,介绍了多光谱成像技术的成像原理,选取特定的窄带滤

学位

多光谱成像组织光学光谱重构血氧饱和度

人工湿地在畜禽养殖废水处理中的应用前景研究

畜禽废水已成为农村一个主要的面源污染来源,针对这种污染现状,近年来出现了许多废水处理方法。在概括分析了畜禽废水的研究现状后,提出了人工湿地处理技术。通过对人工湿地研究现状的综述,阐述了人工湿地在净化污染物方面的研究进展。并通过对人工湿地在畜禽养殖废水处理中应用的介绍,分析了人工湿地存在的优势和问题,提出了人工湿地在畜禽养殖废水处理中具有广阔的应用前景。

会议

畜禽养殖废水人工湿地净化研究应用前景

语义分割中的视觉语义表示模型研究

在计算机视觉领域,语义分割是一项十分基本和重要的任务。随着计算机硬件性能,尤其是GPU用于数值计算技术的不断进步,深度学习得以不断发展。全卷积神经网络的出现,使得基于深度学习的语义分割方法取得快速地发展,然而基于视频数据的分割方法获得了较少的关注。视频数据相比于图片数据,多了一维时间序列信息,如何更有效地利用该信息对科研人员提出了挑战。另外,对于智能决策系统来讲,预测未来的能力对于决策来讲具有现实

学位

深度学习计算机视觉视频语义分割特征表示

基于多任务学习的多层次时间序列的联合预测研究

多层次时间序列指的是由加和关系限制的一组时间序列。多层次预测被广泛应用在电力需求预测、旅游业数量预测以及商业税收预测等统计学、经济学领域。现有的多层次预测方法通常基于一种“两步法”策略。首先,对层次结构中所有的时间序列单独进行预测,然后,采用不同的调和预测算法使其满足加和一致性的限制条件。然而,“两步法”不仅计算复杂度高,而且无法确保所有时间序列的预测是整体最优的。为了解决上述问题,本文从多任务学

学位

多层次时间序列联合预测多任务学习线性回归深度学习

基于视觉语义表示的视觉对话方法研究

随着深度学习技术的不断发展,计算机视觉领域与自然语言处理领域相结合的相关任务研究逐渐成为计算机领域中的一个研究热点。虽然之前已经有相关的研究,如图像语义描述生成以及视觉问答任务,但是这两个任务都只能通过单次交互帮助人类对图像中的信息有基础的了解,而现实生活中对图像中内容的理解是一个循序渐进的过程,即需要通过多次交互对图像中部分内容进行理解,进而通过不断累积最后实现对图像中全部内容的理解。因此,为了

学位

视觉对话视觉表示语义表示注意力机制

视频问答中多步推理和视觉定位方法研究

视频问答是多媒体领域和计算机视觉领域中的热门研究课题。该任务要求模型能够根据视频内容和自然语言问题生成答案。这是一个多模态任务,需要问答模型同时对视觉信息和语义信息进行认知和理解,并且融合两个模态的信息进行推断。近年来一些学者开始关注更为复杂的视频问答任务及方法。其一是视频问答中的多步推理,即问答模型能够对包含多重逻辑运算操作如数学运算和属性比较的问题进行解答。其二是将视频问答与视觉定位两个多模态

学位

视频问答多步推理视觉定位深度学习数据集注意力机制

基于RFID技术的倾斜物体检测方法研究

随着商品物流的增加,特别是对外贸易的加大,在物流和仓储过程中,物体由于倒置或倾斜而引起的严重损坏增多。一些敏感的物体包装上特别标有物品需向上放置的标识,一旦运输过程中发生倾斜,轻则导致经济损失,重则发生危险。如家用电器,医疗设施,化学试剂等。此外,在图书馆中,书籍也会被垂直放置以便查阅。RFID（Radio Frequency Identification,射频识别技术）的兴起和不断完善给进一步提

学位

射频识别倾斜物体检测移动性

基于特征隐含关系的稀疏预测研究

稀疏数据是在数据集中绝大多数数值缺失或者为零的数据,如何挖掘稀疏数据特征之间的隐含关系从而对其进行预测分析是本文的主要研究问题。目前,主流的挖掘特征间隐含关系的方法无法较全面地抽取特征间隐含关系进行更深层次的学习。通过在特征学习过程中对特征和特征之间的隐含关系进行丰富和扩充,从而提高对特征间隐含关系的学习能力。本文提出一种基于特征之间隐含关系的稀疏预测方法,结合丰富的特征信息参与特征间隐含关系的自

学位

稀疏数据隐含关系FIRMInteractionNNMINN

自适应的RDF分布式处理方法

知识图谱近年来得到了广泛应用和扩展,其标准数据模型RDF图数据表现出的复杂性、稀疏性和多样性,造成了RDF处理引擎在存储和查询过程的复杂性,进而导致查询响应的低效性。目前大部分引擎对常见RDF数据特征进行固定模式的处理,无法体现出灵活性。因此研究自适应的RDF处理方法对知识图谱数据处理具有重要意义。本文设计并实现了自适应的RDF处理方法,从存储和SPARQL查询两个方面来提升RDF数据处理的性能。

学位

RDF自适应SPARQL分布式

基于关系推理的软件安全知识图谱补全

软件安全知识包括异质软件安全概念（例如,软件缺陷和攻击模式）和软件安全实例（例如,某个特定软件产品的安全漏洞）,它们都可以被视为软件安全实体。软件安全实体间具有许多类型内以及跨类型关系。软件安全实体间的关系推理有助于丰富现有的软件安全知识,并对紧急出现的软件安全实体作出解释。然而遗憾的是,软件安全实体目前被记录在不同数据库的超文档中,这种超文档的表示方式不支持软件实体间关系的有效推理。此外,现有的

学位

软件安全实体与关系知识图谱向量化关系推理随机游走

面向紧致表示的多视角学习

与本文相关的学术论文