【摘 要】
:
跨模态检索是多模态学习领域中一项十分重要的研究。不同的数据类型,如图片、语音、文字等有其固有的特征,称之为不同模态的数据。跨模态检索旨在探索不同模态数据间的语义关联信息,为处在不同模态、但具有相同语义信息的数据建立语义连接。从而可以跟据语义连接对不同模态间的数据进行检索。本文主要聚焦于图片和文本两个模态间的检索。当前主流跨模态检索算法都着眼于模态内的细粒度信息,如图片中的显著性区域和文本句子中的单
论文部分内容阅读
跨模态检索是多模态学习领域中一项十分重要的研究。不同的数据类型,如图片、语音、文字等有其固有的特征,称之为不同模态的数据。跨模态检索旨在探索不同模态数据间的语义关联信息,为处在不同模态、但具有相同语义信息的数据建立语义连接。从而可以跟据语义连接对不同模态间的数据进行检索。本文主要聚焦于图片和文本两个模态间的检索。当前主流跨模态检索算法都着眼于模态内的细粒度信息,如图片中的显著性区域和文本句子中的单词等。通过将两个模态内细粒度特征对齐,从而实现模态间整体语义结构的对齐。但是这些方法往往只关注对模态间的实体信息进行语义对齐,忽略了模态内各个细粒度特征间的语义关联信息,在检索过程中容易造成歧义。对于跨模态检索任务而言,细粒度特征的对齐意味着两个模态内包含有相同的实体信息,但各个实体间的关系并不确定,导致不同模态表达的语义信息会存在不一致,造成歧义。因此,对模态内的细粒度特征间的关联信息进行建模是十分有必要的。由于保留了模态内的局部性结构信息,增加了关联信息的细粒度特征更具有鉴别性,因此,当两个具有关联信息的细粒度特征进行匹配对齐时,也是在对该细粒度特征所在的局部结构进行对齐。这使得训练得到的网络具有更强的泛化能力,能够识别模态间较为复杂的局部结构,提高模型检索精度。针对上述问题,本文从模态内细粒度特征间的关联信息出发,对其进行建模推理。实验结果表明,本文提出算法可以较好的对模态内细粒度特征间的关联信息进行建模,捕获到细粒度特征的局部结构信息。本文主要工作如下:(1)提出了一种基于掩码注意力的图网络跨模态检索算法。为解决图片-文本模态间的存在的语义鸿沟问题,当前细粒度跨模态检索算法主要采用注意力机制构建新的共享语义空间,继而计算查询模态与共享语义特征间的相似度,从而构建查询模态与其对应模态间的语义关联。采用注意力机制可以使得重要的细粒度特征获得较多的关注,不相关的特征获得较少的关注。但不相关的特征仍会对构建的共享语义空间产生影响,造成歧义。本文提出算法通过对模态内细粒度特征间的关联信息构造掩码,进一步消除模态内不相关特征的影响,同时增强了重要特征在共享语义空间中的表达。(2)提出了一种基于Transformer的相似度推理跨模态检索算法。为更精确的捕获细粒度特征间的关联信息,从而对模态内的局部语义结构进行建模,提高检索准确性。本文提出算法采用Transformer对模态内细粒度特征间的相似度信息进行推理。通过Transformer结构中相似度信息间的信息传递,使得每个相似度向量学习到其局部语义结构信息,有助于模型进行更为复杂的模态间匹配与检索,提高了模型的检索精度。(3)提出了一种基于关系推理的细粒度跨模态检索算法。算法基于图神经网络和Transformer结构,分为两阶段完成,可以更为精确的对模态内细粒度信息间的关联信息建模,模态间局部结构匹配。第一阶段采用图神经网络构建,基于两个模态内的细粒度特征构建语义结构图,将模态内的细粒度特征作为节点,细粒度特征间的关联信息作为边。使得细粒度特征在保留自身实体信息的基础上,学习其与邻居节点间的关系信息,有助于两个模态间局部结构信息的匹配。第二阶段采用Transformer结构对细粒度特征间的相似度信息进行推理,进一步增强了细粒度特征间的关联信息,提升了模型的检索能力。
其他文献
进入新时代,我国区域发展动力极化态势愈发突出,现代化都市圈成为承载经济和人口的重要发展高地。都市圈作为介于中心城市和城市群之间的一种空间形态,已被国际经验证明是促进区域一体化均衡发展的重要抓手。正处在快速成长期的郑州都市圈是中西部都市圈的典型代表,已经成为促进中部地区崛起的核心一级,但仍有诸如存在行政边际效应、交通发展不均衡、核心圈层动能不强、内外联动不足等问题。扩容后的郑州都市圈,应立足区域一体
制糖要经历"提取蔗汁、清净除垢、蒸煮浓缩、凝浆成晶"的过程,对应"思想洗礼、锤炼品质、升华提高、永葆纯洁"的廉政理念。如今,内江在"甜文化"的基础上深度挖掘廉洁文化,结合传统廉政文化、近代革命文化、新中国工业建设文化,持续探索培育具有内江特色的廉政文化体系,成效正显。
针对工件上多个不同直径管道的筒体内壁焊缝位置信息难于提取的技术问题,设计了一种能识别支管空间位置和尺寸信息的焊缝位置识别传感器,通过该装置采集到的数据,结合已知工件空间位置和尺寸信息,建立管道插接焊缝的位置模型,并推导出基于此模型的焊缝特征矩阵和焊枪姿态矩阵.将采集的数据结合上述数学模型,在MATLAB软件中进行仿真对比.结果表明,其精度误差最大为0.25 mm,满足实际焊接精度要求,验证了该传感
随着城镇化建设步伐加快,我国房屋建筑工程项目数量不断增加。为满足建设需求,提高项目收益,需要加强工程造价管理。在整体造价管理中,预结算审核是关键部分,直接影响造价管理结果。基于此,文章立足于房屋建筑工程造价管理,对相关预结算审核展开研究,旨在为相关房屋建筑工程成本管控提供参考。
大单元教学主要是一种促进教学改革的教学模式,主要以任务驱动、情境体验作为指导方针,为教学活动指明基本的方向。大单元教学强调培养学生的主动性与自主性,高中语文教师通过创设情境加深学生的认知,引导学生们在情境中掌握学习重难点。因此,本文首先说明大单元教学概念,再叙述高中语文大单元教学中情景创设的有效策略。
装配式建筑是现代化工程建设的重要组成,在装配式建筑工程建设当中进行有效的造价管理可以提升其施工质量,也能够进一步保证其经济利润。装配式建筑工程造价管理中面临着价格信息失真、计量规范不准确、项目计价依据缺失以及构件成本过高等问题。在装配式建筑工程造价管理中,相关单位需要注重工程在跟阶段的工程造价合理规划,从建筑工程决策阶段到竣工验收阶段,广泛收集各类造价资料信息,加强施工过程管控,进行造价的有效管理
近年来,我国企业内部审计工作取得了一定的进展,但与国外一些成熟企业相比,仍有一定差距。本文对民营企业内部审计的应然职能以及在当前实际运行中存在的问题进行梳理,并给出一些具有建设性的建议。
危害辽宁省松树的检疫性害虫有松材线虫、红脂大小蠹和日本松干蚧,3种害虫均具有寄主范围广、传播速度快、致病力强、传播途径多样等特点,威胁辽宁省松林生态安全,本文介绍3种害虫发生现状,并提出了防治对策。
<正>鄂政办发〔2022〕24号各市、州、县人民政府,省政府各部门:《关于加强金融助企纾困工作若干措施》已经省人民政府同意,现印发给你们,请结合工作实际,认真组织实施。2022年5月30日关于加强金融助企纾困工作若干措施为深入贯彻落实党中央、国务院关于稳增长的决策部署和省委有关工作要求,全力稳住经济大盘,进一步加大金融助企纾困和帮扶受困群体力度,帮助更多市场主体应对疫情冲击、渡过难关,促进全省经济
数字化转型为企业实现高质量发展提供了重要契机。本文利用2007—2020年我国上市公司数据,运用深度学习方法构建企业数字化转型指标,并基于股价协同性视角验证了指标的有效性。在此基础上,本文考察数字化转型对企业融资成本的总量效应、作用机制以及异质性影响。研究发现:数字化转型使得企业融资成本显著降低;机制检验显示数字化转型可通过缓解信息不对称和增强盈利能力来降低企业债务成本;异质性分析表明数字化转型对