基于对抗式训练的通用多模态学习方法研究

被引量 : 0次 | 上传用户:FSM0225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多模态学习旨在利用不同模态数据之间的隐含的关联性实现对多模态语义的协同理解能力,从而实现对复杂环境和任务的更好的理解。随着人工智能技术的发展,多模态学习的研究日益重要。目前多模态学习的主流方式是通过“预训练-微调”的方式在一个大框架下解决多种多模态任务的通用多模态学习。图像数据和文本数据是最常见的两种类型的数据,本文所研究的通用多模态学习方法将聚焦于“图像-文本”的多模态场景,包括视觉问答、视觉目标定位、图文检索三个典型的多模态学习任务。目前通用多模态学习方法主要依靠多模态预训练来实现,这些方法在预训练阶段和微调训练阶段面临着不同的挑战。在预训练阶段,多模态模型需要学习跨模态的语义关联,同时尽可能地学习细粒度的语义对齐,目前大多数方法只能进行粗粒度的语义对齐学习;在微调训练阶段,由于数据量的锐减,多模态模型在该阶段面临着更大的过拟合风险,一些工作尝试将对抗式训练的方式引入到该阶段增强模型的泛化性与稳健性,但同时也增加了许多时间开销。针对上述问题,本文的研究主要形成以下两种方法:1、为了解决通用多模态模型在预训练阶段需要进行细粒度语义对齐学习的问题,本文提出基于对抗式掩码学习的通用多模态预训练方法LTM。该方法提出了一个对抗式掩码生成网络,并与多模态预训练模型在一个对抗式训练的框架下进行训练。对抗式掩码生成网络会倾向于将文本中与图像相关的词或图像中与文本相关的区域选为掩码,这样的掩码方案对于多模态模型学习跨模态的细粒度语义对齐有很强的针对性。最终的实验结果证明了这种显式增强跨模态细粒度语义对齐方法的有效性。2、针对通用多模态模型在微调训练阶段容易过拟合的问题,本文提出基于对抗式特征扰动的快速通用多模态微调训练方法MAP。该方法同样在对抗式训练的框架下进行,并依靠一个对抗式扰动生成模块在输入数据的特征层面施加对抗扰动。与现有的基于对抗式训练的多模态模型不同,该方法使用一个可学习的对抗式扰动生成模块根据多模态网络的输出自动地生成对抗式扰动。在训练中,该方法还使用了一种快速训练方式,极大地减小了对抗式训练所带来的时间开销。最终,在三个多模态任务上的实验结果验证了这种对抗式特征扰动方法的有效性和通用性。
其他文献
基于整体教学理念,围绕“用尺规作五角星”这一主题,有效整合教学内容,挖掘知识内在联系,把握知识本质结构,从整体上把握教学内容,促使学生完整建构知识体系,发展核心素养。
期刊
近年来,随着我国进入老龄化社会进程的加快,国内养老需求不断增多,传统地产在精细化发展过程中,出现了专门以康养为主题的地产项目,即将度假、养老、医疗、地产等多种功能集合在一起的地产项目。2012年,知名地产公司F地产在惠州投资的康养项目开盘,这是F地产在康养地产领域布局的试点项目之一。本文将以F公司项目为研究对象,通过PEST分析法,对项目所处的政治(P)、经济(E)、社会(S)、技术(T)等环境进
学位
<正>一、简单回顾,明确围读要求师:同学们,上节课咱们说今天我们要用一种特别的方式来走近鲁迅先生,还记得是什么吗?生:围读会。师:是的。为此我们还做了好多准备,一起来看一看。师:(出示准备课的图片)我们先读了《我的伯父鲁迅先生》和《有的人——纪念鲁迅有感》这两篇课文,然后以小组为单位,
期刊
<正>壹回忆与章法踏准回忆基点(课前板书:我的伯父鲁迅先生)师:孩子们,今天我们一起学习一篇回忆录,题目叫——生:《我的伯父鲁迅先生》。师:是的。回忆录叙事的笔调温暖而亲切,记录的焦点往往是作者熟悉的人物、事件和时代。(板书:回忆录)师:现在请大家把课本打开,翻到第27课。然后,拿出课堂练习纸,先来完成第一题选择题——预习回顾。请你把选择的序号填在横线上面,然后代进去,完整地读一读。
期刊
<正>产业链供应链安全是确保我国经济高质量发展的基础,我国产业体系虽较为完整,但在全球产业呈现多元化、分散化、本地化发展趋势的背景下,产业链供应链安全面临多重风险挑战。为全面了解当前我国产业链供应链韧性与安全的整体情况,梳理行业企业遇到的供应链韧性与安全痛点难点问题及采取的针对性措施,
期刊
数字金融以数据为核心,以互联网和信息通信技术为基础,可以实现金融业务的自动化处理,并通过对信息进行分析、挖掘与整合,更好地解决供应链各参与方之间的信息不对称问题。在供应链金融中,数字金融可以有效地解决核心企业信用传递与控制的问题,降低供应链金融业务的风险。数字金融在一定程度上提升了工业产业链韧性,但数字金融业务在服务中小微企业、发展中小微企业以及服务产业集群等方面仍存在一些问题。基于此,本文对数字
期刊
<正>"借助相关资料,理解课文主要内容"是统编教材六年级上册第八单元指向阅读的语文要素,这是对"根据需要收集资料""结合资料,体会课文表达的思想感情"等能力的延续和递进。在教学中,如何引导学生借助资料,理解课文主要内容,一步一步走进鲁迅先生的精神世界呢?近日,笔者聆听了特级教师闫学执教的《我的伯父鲁迅先生》一课,获益匪浅。《我的伯父鲁迅先生》是周晔女士在鲁迅逝世九周年时所写的纪念性文章,现选入统编
期刊
在百年未有之大变局和中国进入高质量发展阶段的背景下,明确中国供应链安全面临的挑战与优势,提升中国供应链韧性和安全水平,是构建新发展格局、实现制造业高质量发展、维护国家经济安全的必然要求。中国供应链安全面临着关键核心技术“卡脖子”、供应链“断链”与产业跨境转移等风险,同时也具备产业体系优势、市场规模优势、举国体制优势和数字基建优势。为增强供应链韧性和安全水平,要以新型举国体制推动关键核心技术突破,推
期刊
产业链安全稳定与韧性是保证我国经济循环畅通、实体经济高质量发展的关键途径。轨道交通装备产业作为服务民生与实体经济的重要行业,应注重产业链韧性水平提升。经文献回顾,研究提出了由抗冲击力、保障力、恢复力组成的产业链韧性构架。基于分析研发协作与产业集群因素对产业链韧性的机理,建立了三者影响关系。在实践方面,对企业提升产业链韧性给出了建议。
期刊
空间正义研究在社会公平公正发展中有着重要意义,但在旅游古镇领域尚未得到充分重视。以大理市双廊古镇为例,采用访谈法,以空间正义理论为价值导向,梳理双廊古镇在旅游发展过程中旅游空间正义现状并探究成因,进而讨论旅游空间正义优化路径。研究发现:双廊古镇在资源可及性、空间生产、旅游参与机会以及利益分配等方面存在空间非正义现象。鉴于此,针对其问题进行成因分析并提出优化路径。为巩固新时期民族地区古镇旅游扶贫成果
期刊