基于视觉信息的多模态机器翻译方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:TNicholas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视觉信息的多模态机器翻译是指在文本机器翻译的基础上,以图像或视频的信息作为辅助帮助模型理解上下文从而提高机器翻译系统性能。通常的方法是在编码端将两种不同模态的信息融合。本文针对基于视觉信息的多模态机器翻译的两个子任务文本-图像机器翻译和文本-视频机器翻译进行研究,分析了该领域存在的问题:一是缺乏统一的多模态机器翻译框架能通用地适用于两个子任务;二是在图像信息中存在着与文本无关的内容,冗余的图像信息会对翻译系统造成影响,在模型内部对图像中的噪声信息进行过滤选择真正与上下文有关的部分是一个非常值得研究的问题;三是在文本-视频机器翻译任务中,视频特征和文本特征都具有时序性,而现有的模型忽略了这一特点。针对上述问题,本文进行了以下三点研究:1.提出了通用的多模态机器翻译框架。目前在基于视觉信息的多模态机器翻译缺乏一种翻译框架可以同时处理两个子任务,本文提出的通用的多模态机器翻译模型以感知文本的视觉表示为基础,引入了多模态门控网络对视觉信息进行选择融合,可以通用地处理两个多模态机器翻译的子任务。其中文本-图像机器翻译任务在三个测试集上的BLEU指标和METEOR指标均达到了最优或接近最优的结果,文本-视频机器翻译任务在VATEX数据集上与VATEX提供的基线模型相比,BLEU值提高了4个点。本文中的其他方法均以本文提出的通用的多模态机器翻译框架作为基线模型。2.提出了选择性注意力机制。选择性注意力在模型训练过程中动态地选择图像特征中与当前词语义关联密切的区域,并通过Gumbel重参数的方法实现了选择过程可微分,进而模型能通过反向传播进行参数更新。作为对图像去噪的一种补充,本文同时引入了文本图像语义相似度损失函数进一步对两个模态的表示信息加以约束。实验结果和实例对比都表明了选择性注意力在文本-图像多模态翻译任务上有效的去除了图像特征中的噪声并提高了翻译效果。3.提出了多模态注意力中的相对距离。在基线模型中的多模态注意力中,为多模态特征对分配多模态距离向量,并将多模态距离向量融合到注意力得分矩阵计算和最终加权和输出中。实验结果表明基于相对距离的方法可以显著提高翻译结果,本文的方法在VATEX公开测评榜上取得了第四名的成绩。
其他文献
学位
随着我国经济社会发展方式的全面转型,高质量发展、高品质生活已成为新时代发展要求,坚持以人为本的城市规划,要让人民群众有更多的获得感。因此,需要我们对城市公共服务设施配置进行不断的完善,促使人们的需求能够得到最大程度的满足。教育设施是城市公共服务设施的重要组成部分,对中小学的空间布局合理性及落地实施进行研究,不仅有助于实现教育设施的公平性与均等化,使其更好地适应城市的变化以及民众的需求,还有助于完善
DL工程公司成立于1998年,是首家将非开挖各种技术方式中的水平定向钻铺管技术(Horizontal Directional drilling)(以下简称“HDD”或“HDD技术”)在中国应用的公司。当时HDD技术在国内还是一个非常陌生的、绝大多数建设单位、设计单位以及施工单位对此一无所知的技术。DL工程公司的创业团队的主要力量是来自高校的专业教师,凭借他们对HDD这项新技术的消化理解能力,迅速建
伴随着中国生态环境保护理念与城市建设中底线意识的加强,扩张式的城市化发展进程受到一定限制后,进而转向内部存量空间优化。城市滨水空间成为当下城市空间更新与活力重塑的热点。但是,由于缺少城市滨水空间活力理论的引导,许多城市滨水空间的提升依旧停留在单纯的物质景观设计上,既缺少从中观层面对城市滨水空间系统的研究,也忽视了城市滨水空间与居民日常休闲活动的关系,从而导致了城市滨水空间活力不足的问题。因此,笔者
随着国家经济实力提升,农村经济增长,村镇银行的综合实力在一步一步提升。尽管村镇银行得到了发展,但受限于村镇整体的金融市场不发达,金融运作手段主要以信贷为主,抵押类贷款更是信贷业务中的核心业务。随着银行同业间竞争日益激烈,为了能够在竞争中保持足够的市场份额,村镇银行对信贷审批对象放宽政策,导致了较多抵押类不良贷款的产生。如何加强抵押类不良贷款的管理成为了村镇银行目前急需解决的问题。本文基于分析H村镇
旅游业在世界经济中的地位日益重要,在许多国家的长期经验基础上,已成为许多发展中国家最重要的出口部门,这些国家通过旅游业维持和改善国民经济,在柬埔寨迅速发展,为柬埔寨的发展做出了重要贡献经济。目前,国际旅游无论是在提供新的职业机会方面还是在许多国家作为交换收入的基础,都已成为主要问题之一。由于旅游业是外汇的主要来源,它提供了积极的外部性并为实体部门创造了附加值。它鼓励资本积累和开展新的投资活动。国际
随着第24届冬奥会落户北京,我国冰雪运动发展迅速,越来越多的人参与到冰雪运动当中,选择冰雪旅游也成为了一种时尚。冰雪运动产业蓬勃发展,随之而来“互联网+”冰雪运动平台也具有极大的市场前景和开发潜力,但是整个“互联网+”运动产业还存在提供内容服务单一、线上线下脱轨严重、用户活跃度低、缺少盈利模式等诸多问题。本论文以“中国雪托帮”平台为研究对象,对平台的运营管理策略进行研究,结合国内外冰雪运动和文化旅
近几年来,中国制药企业面对的不仅仅是与国际市场接轨后产品的竞争加剧,从国内行业发展现状看,还面对着医疗体制改革过渡期的政策环境变化。尤其是2015年以来,国家出台的政策对制药企业特别是中药企业带来的宏观压力是前所未有的,一方面,国家面对诸多医疗体制改革的诸多难点问题,另一方面,中药产品的特质严重影响其参与国际市场竞争,其中,以中药化学成分不清为代表的“先天不足”,为中药走出国门设置了难以逾越的门槛
我国已然成为举世瞩目的“建筑大国”,且建筑业的发展对国民经济的增长及社会民生的改善起到举足轻重的作用。但我国建筑业企业普遍面临利润获取能力偏低的困境,究其根本,往往不是因企业施工技术落后、管理制度缺失等原因,更多的是对处在施工一线的工程管理团队建设不合理,导致其管理能力偏弱,从而限制了企业获取利润的空间。本文选取CSCEC1041工程管理团队为研究对象,在对能力评价理论进行梳理和分析的基础上,阐述