面向跨模态检索的协同注意力网络模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:czronick
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像、文本、声音、视频等多模态网络数据的急剧增长,人们对多样化的检索需求日益强烈,其中的跨模态检索受到广泛关注。然而,由于其存在异构性差异,在不同的数据模态之间寻找内容相似性仍然具有挑战性。现有方法大都将异构数据通过映射矩阵或深度模型投射到公共子空间,来挖掘成对的关联关系,即图像和文本的全局信息对应关系,而忽略了数据内局部的上下文信息和数据间细粒度的交互信息,无法充分挖掘跨模态关联。为此,文中提出文本-图像协同注意力网络模型(CoAN),通过选择性地关注多模态数据的关键信息部分来增强内容相似性的度量。
其他文献
近些年来,随着无人驾驶、火星探测器和载人潜水器等领域研究热度的持续上升,导航系统越来越被人们所重视,MEMS磁强计、MEMS陀螺和光纤陀螺作为导航系统中重要的姿态信息传感器,其环境适应性和抗干扰能力的强弱能直接影响最终的导航精度。基于此,本文围绕环境磁干扰误差、随机噪声误差和温漂误差的产生机理及其抑制方法开展相关研究,内容主要覆盖以下几个方面:首先介绍了MEMS磁强计、MEMS陀螺和光纤陀螺的基本
报道了相同实验条件下激光二极管端面抽运生长型复合Nd:YVO4晶体声光调Q和RTP电光调Q激光器。应用声光调Q和RTP电光调Q分别实现了最高重复频率200 k Hz和500 k Hz的TEM00模1
早在20世纪70年代,一些发达国家和地区的医学营养专家对羊奶的营养价值进行了研究,发现羊奶与母乳极为相似,所以这些专家在提倡母乳喂养的同时,建议没有母乳来源的家庭,将配
目的探讨风险护理对急诊留观患者护理不良事件的影响。方法选择2018年10月至2019年7月我院急诊科112例留观患者作为研究对象,随机分为对照组与观察组,对照组行常规护理,观察
在当前阶段全面深化南京市农村金融改革,建立现代化农村金融体系,对南京市解决"三农"问题、实现农村经济转型、发展现代农业具有重要意义。本论文对当前南京市农村金融发展战
【正】 通化铁厂洗煤厂是个老企业.解放时保留下来的设备陈旧落后,入洗原煤少,资源能源消耗高,生产效率低,污染环境严重.近几年来,他们结合技术改
目的探究颈内静脉置管患者的临床护理。方法 对从2016年11月到2019年2月来我院进行治疗的168例颈内静脉置管患者进行精心护理,具体包含预防感染、防止堵管、防止出血等护理内
目的本文通过对重型颅脑损伤患者治疗措施进行分析,从而研究预见性护理方式的治疗价值。方法护理人员患者采用预见性护理与优质护理相结合,提前准备好治疗和护理措施,同时防
目的:分析小切口抽脂联合连续埋线重睑成形术在不对称双眼皮整形修复中的临床效果。方法:2018年9月-2019年5月收治不对称双眼皮患者95例,随机分为两组。对照组采用切开法重睑
目的评价在灌注指数(PI值)监测下对经桡动脉行冠脉造影(CAG)术后穿刺处的护理。方法选择2017年07月~2018年11月间我院心内科收治的100例经桡动脉行CAG冠心病患者,按照数字表