基于自上而下注意力机制的视觉问答模型研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:S20090908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉问答是近年来人工智能领域兴起的热门研究方向之一,VQA的核心问题是如何构建图像与问题之间的关联关系。图像与问题之间存在着语义鸿沟,阻碍了图像与问题中语义信息的有机融合。解决语义鸿沟问题的一个基本思路,是同时对图像和问题进行处理,以找出两者之间的强关联部位。为此,本文针对图像和问题之间的有机融合与关联问题开展研究,并据此设计高性能的视觉问答模型。本文的主要工作如下:(1)视觉问答模型广泛采用了注意力机制来突出关键信息的作用,抑制无关信息的影响,但是现有模型多倾向于使用问题信息去关注和处理图像,而很少使用图像信息来关注和处理问题,使得对问题中关键信息的提炼失去根据,影响了视觉问答模型的整体性能。为此,本文提出了一个基于级联的自上而下注意力机制模型。该模型利用问题来引导图像注意力,以突出图像中的重要区域,同时也利用图像来引导问题注意力,以突出问题中的重点单词,这样既能有效地突出与问题相关的图像区域,也能有效地突出与图像相关的问题单词,使得图像和问题之间的关联更加紧密。该模型在两个公开的视觉问答数据集上进行了实验,实验结果表明,该模型可以有效提高视觉问答的整体性能。(2)目前视觉问答模型采用的注意力机制,广泛存在着归一化操作。本文的研究表明,这可能是一个薄弱环节,因为在处理同时涉及图像中多个区域信息的复杂问题时,归一化操作会降低模型对图像多个区域同时关注的能力。为此,本文提出了基于多层图像特征融合的注意力模型。该模型多次利用问题对图像施加注意力机制,然后突出图像中与问题相关的多个区域,以解决那些需要多个图像区域信息才能回答的问题,从而提高VQA任务的整体性能。该模型在两个公开视觉问答数据集上进行了实验。实验结果表明,该模型有效地提高了视觉问答的整体性能。
其他文献
当围绕某一中心天体运动的两个或多个天体的轨道周期存在或接近一个有理数的比值时,这类轨道称为共振轨道。对天体系统而言,共振是系统引力之间长时间演化的结果,探测器的共振轨道则是可设计的,具有潜在的应用价值。本文分别给出了地月系统中二体问题和圆型限制性三体问题下的共振轨道的设计方法,并分析了共振轨道的两个重要初始参数对轨道动力学特性和运动规律的影响;以开普勒能量和月球影响球半径作为判断准则,得到了引起圆
脊柱侧凸是一种较为常见的骨科疾病,易发于青少年人群。脊柱侧凸病症轻则影响身体协调和美观性,重则会影响婴幼儿及青少年的生长发育,甚至影响心肺功能,造成严重的并发症。严
过去一个世纪无线通信技术得到高速发展,无线通信网络和应用已经成为人们日常生活的重要部分。随着无线通信业务需求的增长,未来无线通信网络不仅要面对无线频谱资源短缺的挑
随着集成电路的复杂度不断增大以及电路模块化设计方法的盛行,集成电路在设计和生产过程中产生了大量的未知位(X)。电路中X值的传播会严重影响整个测试过程的测试质量,X值的
铁路扣件作为连接钢轨和轨枕的部件,是铁路运输安全的重要保障。通过计算机视觉技术检测扣件状态,具有十分重要的工程价值。扣件检测任务属于图像分类问题,目前常用的扣件检测算法流程为:由轨检车获取扣件图像后,根据图像的底层特征,将扣件分类为正常类别和失效类别。由于扣件姿态不一、道砟遮挡、光照变化、失效形式多样等因素,底层特征无法稳定的描述图像内容,导致分类结果与扣件图像的真实语义不同。图像底层特征与图像真
破产重整制度是旨在挽救处于困境中的企业,使企业获得重生希望的制度安排。因此,在破产重整程序中,应同时考虑债权人、职工安置、地区经济发展、政府税收、社会的安定等多个
能源消耗在推动经济高速发展的同时,也产生了大量的碳排放。由此引发了全球变暖、海平面上升等一系列环境恶化现象,严重威胁着人类的生产和生活安全。低碳经济在此背景下应运而生,在发展经济的同时进行碳减排已刻不容缓。作为世界上最大的发展中国家,中国政府作出了 2020年碳排放强度较2005年下降40%-45%的碳减排承诺,并要求各省份结合自身情况进行具体的减排目标规划。山东省作为我国的经济发展和能源消耗大省
磁通门传感器是一种具有较高灵敏度和测量精度以及体积小、重量轻等特点的弱磁矢量测量传感器。尤其是近些年,随着弱磁测量技术的广泛应用,消费级市场需要大量性能优异且成本低的磁测量设备。但是传统的模拟磁通门传感器,其信号处理电路的性能易受温度、电磁干扰的影响,且难于集成,使得具有抗干扰能力强、集成度高、成本低等优点的数字化磁通门传感器已成为一种技术发展趋势。本论文在分析传统模拟磁通门传感器理论的基础上,深
金属管、板材固体颗粒介质成形新工艺(Solid Granules Medium Forming Technology,SGMF)是利用颗粒代替刚性凸模的作用对管材成形的新工艺,该工艺具有成形过程无污染,介质可重复使用、易于密封、成本低等特点。成形中颗粒介质具有压力分布不均的特性,可以通过控制压力分布使材料在最有利条件下变形,更好的提高成形极限,发挥材料成形性能。颗粒介质的流动性能将决定所成形零件的
行政机关在行政管理活动中时常会改变瑕疵行政行为,但是不受限制的改变往往会导致行政纠纷的发生。因而,为了更好地解决行政机关改变瑕疵行政行为所带来的问题,研究行政机关改变瑕疵行政行为及其司法审查十分有必要。第一部分首先阐述法院审查行政机关改变瑕疵行政行为的状况。从判决中归纳出司法实践中,法院根据瑕疵程度不同认定的瑕疵类型,主要有未达到撤销程度的轻微瑕疵以及需要采用撤销处理的瑕疵。此外还分析了法院在认定