基于单模态及多模态数据的多模态学习

来源 :南京大学 | 被引量 : 0次 | 上传用户:xiang43
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日常生活遍布着各种各样的数据,如语言,文字、图形和声音等,类似这样的事物的存在方式就是模态。而多模态指的是两个及以上的模态整合在一起的各种形式组合。通过学习多个模态中各个模态的一致性和互补性,并完成各个模态之间的信息转换和交流便是多模态学习。最近几年,随着大数据技术的大幅度提升以及深度学习技术的快速发展,多模态学习技术有了进一步的发展。深度多模态学习是多模态学习技术发展的必然产物,它继承了传统多模态学习的学习任务和目的,并用深度学习技术推进了多模态学习的发展和进步,而且还取得了显著的效果。在多模态学习领域,目前大多数方法都可以从模态中提取有用的信息来提高算法的性能,但是依旧存在很多问题没办法合理解决,比如:模态的不充分性、实际数据无标记的较多以及单模态怎么利用多模态学习方法来进行学习。本文考虑在现实的复杂情景中存在的问题,基于单模态和多模态数据在不同的情况下对多模态学习做出如下研究:1.现有方法没有充分利用模态的一致性和互补性以及现实数据多为无标记数据的问题研究。现在大多数多模态学习方法都只是单一的考虑模态的一致性或者互补性性质,但是实际上,实际数据是十分复杂的,仅仅考虑数据模态的一致性或者互补性是不合理的,很容易导致学习性能大幅度降低,从而影响模型的泛化能力。而且实际任务中,数据大多数是无标记的,但是现有的多模态学习方法很少有能够有效地利用未标记数据来提高算法的性能。因此为了解决这些问题,我们提出了一个新颖的综合性多模态学习框架。该模型取得了模态一致性和互补性之间的平衡。具体来说,首先我们利用实例级别的注意力机制来加权不同模态下每个实例模态信息来获取实例整体的充分性,接着我们设计了新颖的正则化度量来衡量模态的互补性,最后我们通过使用鲁棒的一致性度量来发现未标记数据中模态的一致性。实验表明该模型在真实数据上能取得不错的效果。2.单模态构建多模态互补拆分问题研究。现实应用中,数据大多以单模态的形式存在,这成为使用多模态学习技术的障碍。虽然目前有一些多模态学习方法已经可以处理单模态数据——将单模态数据构建成多模态数据,但是这些方法往往在模态拆分的过程中忽略了模态互补性这个原则,过分强调模态一致性原则。因此为了解决这个问题,我们在短文本匹配任务中进行一些研究,并提出了基于局部交互构件的双网络文本匹配模型。该模型将单模态短文本数据构成两个模态:用于描述局部交互的位置结构模态和用于全局语义信息提取的全局语义理解模态,由两个异构网络分别来提取两个模态的特征。该模型通过构建每个模态的差异性来实现模态的互补性原则。与此同时,通过注意力机制将位置结构模态的位置信息传递给全局语义理解模态来获取一致性的综合信息从而实现模态的一致性原则。在此基础上,我们通过设计低阶交互函数和高阶交互函数并利用长短期记忆网络来分别对位置结构模态和全局语义理解模态进行了技术提升,从而大大提升了该模型在短文本匹配中准确率。
其他文献
随着我国城市建设逐年增多,建筑拆迁遗留的废弃物数量也逐年增加,目前我国急需解决的两大主要问题是建筑废弃物的处理和建筑材料供应。一方面,城市的更新改造和建设每年产生
柱塞主缸作为汽车的制动助力件,其工作状态下各腔室密封性是由安装于密封凹槽处的密封皮碗保障,影响密封性的主要缺陷类型有:1)密封凹槽表面存在砂眼、划痕等缺陷;2)与凹槽面
在传统的照明应用场合中,为了满足大功率和高光通量,LED一般由阵列的形式出现。但由于单颗LED之间的个体差异,需要考虑LED阵列各LED串之间的不一致性问题。能馈式LED阵列驱动
在有机电致磷光技术中,主体材料起到分散客体、抑制淬灭的关键作用。目前,亟待解决的一个核心科学问题是如何获得高能隙与双极载流子注入/传输能力兼备的主体材料。现报道的主体材料可分为小分子主体材料、树枝状主体材料、聚合物主体材料。树枝状化合物虽可实现主客体一体化修饰,且具有高热稳定性和良好的载流子传输能力,但是其合成难度大,而且只能用旋涂的溶液加工方式制备器件。而受限于现有的溶液加工技术,旋涂制备的器件
青藏高原是气候变化敏感地区,研究该地区气候及潜在蒸散的变化对区域气候变化的评估具有重要意义。本文以青藏高原为研究对象,用反距离权重法将站点气象数据插值到8km×8km网
神经网络是一种模仿生物神经网络的结构和功能的数学模型。近年来,神经网络因其在信号处理、图像识别、定点计算和大量高速数据处理等领域的广泛应用从而扮演着重要角色。值
Cu-Sn-Zn三元合金镀层有着良好的导电性,耐蚀性,耐磨性以及装饰性,被广泛应用在集成电路,射频元件和仿金仿银等领域。电化学沉积是最有效最方便的手段之一,具有工艺简单、环境适应性较高等特点。本文采用纳米复合电镀技术,分别采用直流电镀法和脉冲电镀法制备了TiO_2颗粒增强Cu-Sn-Zn纳米复合镀层和TiO_2溶胶增强Cu-Sn-Zn纳米复合镀层。研究了TiO_2含量对复合镀层组织及性能的影响,分
近年来,随着供应链管理的思想在企业中的渗透,相关理论和研究也多了起来。传统供应链管理的研究大多基于资金充足的假设,然而随着我国经济的高速发展,供应链与供应链之间竞争的加剧,越来越多的企业开始面临资金约束。同时,理论和实践都充分表明企业的销售努力可以影响产品市场需求,增加供应链的期望利润。基于此,本文研究贸易信贷合同下供应链的运营与融资决策问题,并探讨销售努力对资金约束供应链决策的影响。本文建立了基
micro RNA-167是通过生长素转录因子(ARF)调控生长素吲哚-3-乙酸(IAA)信号通路的重要的micro RNA之一。生长素的滥用会导致其在作物体内含量超标,影响作物生长发育,进一步将影响
系统建模在工业过程控制、预测、优化等各个领域都具有非常重要的作用,由于实际的工业过程对象往往呈现了复杂的动态非线性特征,传统方法难以有效地对这些系统进行建模,而神