基于传递推理网络的场景图生成方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:oldearth
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景图生成旨在检测图像中的目标并预测目标之间的关系,进而构建以目标为节点、关系为边的场景图。场景图生成任务不仅能为视觉内容理解提供图像中潜在的关系,这些关系也是高层次视觉任务的知识基础,因此具有十分重要的研究价值。目前,场景图生成任务的难点主要体现在两个方面:1)从图像中生成信息丰富的场景图需要整合并推理各种目标和关系的交互信息,但现有的场景图生成方法大多由于缺乏关系的高层推理和有效的信息整合机制,仍然难以预测信息丰富的关系。2)现有的场景图生成方法大多融合绝对位置信息来推理目标之间的关系,但绝对位置信息通常只能描述单个目标在图像中的位置表征,而关系的预测往往需要利用两个目标之间的相对位置信息,这导致模型缺乏充足的空间位置信息进行推理。针对这两方面问题,本文开展了以下研究:针对问题1,本文提出了基于传递推理注意力网络的场景图生成方法。该方法由三个模块构成,分别为Transformer模块、目标-关系图注意力模块和传递推理图注意力模块。Transformer模块能够探索目标和目标之间的信息交互,目标-关系图注意力模块可以探索目标和关系之间的信息交互,传递推理图注意力模块首先整合目标和关系之间的交互信息,然后进行关系的高层推理,即关系的传递推理。Transformer模块和目标-关系图注意力模块可以探索图像中丰富的交互信息,传递推理图注意力模块的强大推理能力能够预测更细粒度的关系,从而生成信息更加丰富的场景图。针对问题2,本文提出了基于相对位置信息的无偏场景图生成方法。该方法在传递推理注意力网络的基础上,提出了基于相对空间位置的注意力机制和关系的重加权。基于相对空间位置的注意力机制是在Transformer模块中引入了相对空间位置信息,包括相对距离、相对比例和相对方位,并在此基础上探索了一种基于注意力的融合机制来更有效地整合相对空间位置信息。为了进一步生成无偏的场景图,本文使用重加权的方式对关系的损失函数进行修改,使用重加权后的关系损失来调整关系的预测。本文在场景图生成数据集VG上进行的广泛实验表明,基于传递推理注意力网络的场景图生成方法能够显著提高场景图生成的性能,基于相对位置信息的无偏场景图生成方法能够生成更无偏的场景图。
其他文献
随着云计算、大数据、物联网等技术的发展,互联网中层出不穷的应用引发了数据规模的爆炸式增长。大数据中蕴含着丰富的科研价值与商业价值,却也给用户带来了严重的信息过载问题。推荐系统作为解决信息过载的有效方法,在诸如社交网络、电子商务、流媒体推荐等领域已经有了许多成功应用。在个性化推荐领域,用户的行为非常复杂且稀疏。现有的工作大多采用基于深度学习的序列模型建模用户的行为。然而现有的方法仍然存在以下几个问题
学位
本文考虑用标准差(量子方差的平方根)来量化量子可观测量处于随机哈尔(Haar)分布纯态的不确定性.针对可观测量A在纯态上期望值的概率密度函数(PDF)的计算方法,计算出随机量子可观测量A的期望值和A2的期望值的联合PDF,以及在C3和C4上期望值和标准差的联合PDF的解析表达式,画出了联合PDF的支集的具体图像,在此基础上,进一步计算得到其标准差的PDF的表达式和具体图像.这为更详细研究不确定性关
学位
本文首先研究了{1,2}-边赋权完全图上的最小最大k-路径覆盖与最小最大k-圈覆盖问题,给出了这两个问题的NP-困难性证明,并分别设计了近似算法。其次,研究了2-连通图上的均衡2-划分问题,设计了一个改进近似算法。论文的各个章节具体内容如下。第一章介绍了图论、计算复杂性和近似算法的一些基础知识,并阐述了{1,2}-边赋权完全图上最小最大k-路径(圈)覆盖问题和连通图上的均衡k-连通划分问题的研究现
学位
物联网与5G通信技术的快速发展打破了信息壁垒,为建设未来智慧城市带来了无限可能,各个国家所出台的各项与智慧城市相关的政策,正在逐步提高人们的生活质量。在交通方面,车流量剧增所导致的各种交通事故使得人们的生命财产安全面临巨大的威胁。VANET作为未来智慧城市建设中的重要一环,通过车辆之间的信息互通,实现交通事件、路况变化等各类道路信息及时共享,以此提高道路行车安全。但是VANET自身极易遭受来自各方
学位
非合作微分博弈是指局中人在互不知道对方信息的情况下,根据各自的支付函数而选择最有利于自己的策略的博弈问题.近些年,非合作微分博弈在投资策略、企业间博弈、贸易战等方面应用广泛.本文讨论一类n人非合作微分博弈Nash均衡的存在性及稳定性相关问题.首先,利用集值分析理论,给出了Nash均衡的两个存在性结果,弱化了已有文献中的某些条件,并给出实例说明所获结果的可用性.同时,在状态方程扰动情况下,给出了Na
学位
板的振动问题一直是应用数学与力学领域的热点之一,Mindlin-Timoshenko厚板理论是在Kirchhoff薄板理论的基础上拓展得到的,该模型主要刻画了板的剪切变形,近年来被广泛应用于航空航天领域,因此,研究Mindlin-Timoshenko板的稳定性是十分必要的.本文主要研究具有不同类型阻尼的Mindlin-Timoshenko板系统,证明了系统的稳定性.我们所研究的系统主要分为两类,一
学位
以某深V型船的总阻力、波浪增阻及重心处的加速度为优化目标,对船型的局部型线进行优化设计。在满足总体布置要求的前提下,以底部斜升角、折角线长度为优化对象,通过均匀试验设计的方式,形成9个试验模型;采用经验公式和切片法分别对船型的航行阻力以及波浪中的运动响应进行评估;以简单易用的多项式形成近似模型,采用智能优化算法在样本空间内寻找最优点,提出适合于深V船型水动力性能的多目标优化设计方案。以多目标等权重
期刊
船舶耐波性是船舶与海洋工程专业的一门专业课,在专业课程中融入思想政治教育具有重要意义。在分析船舶耐波性课程思政教育教学现状基础上,通过阐述船舶耐波性的研究历史,培养学生民族意识,增强学生爱国主义情怀;结合具体工程案例的介绍,使学生的责任担当意识得到加强;在传授专业知识的同时,挖掘其中的哲学元素,提升学生人文素质和思想深度。在船舶耐波性课程教学中引入思政元素,达到育人目的。
期刊
纺织品由经纱和纬纱组成。纺织图案定义了经纱和纬纱之间的上下关系。通过物理改变纱线的颜色,相同的图案数据可以生成具有不同颜色组合的纺织品。纱线的实际颜色只是设置织机的问题:通过改变织机上的纱线,可以获得相同图案的不同颜色组合。然而,不同颜色的纺织物编织在材料和时间方面都是昂贵的。尤其是改变经纱的颜色是非常费力的。在提花机织中,改变经纱的颜色需要几个小时到几天的时间。在这项工作中提出了两种基于偏振观察
学位
本文主要针对具有大外飘平台船型(如半潜平台、大件货物运输船等)首部及舷侧结构在高海况下受波浪载荷影响,参考ABS和DNV等规范,借助耐波性软件,通过多点选取,重点分析其在不规则波浪条件下受到的波浪抨击载荷,评估在高海况下进行海上作业的安全性。分析结论可作为此类船型大外飘甲板的设计参考。
期刊