基于语义和常识指导的跨模态图文检索技术研究

来源 :天津大学 | 被引量 : 1次 | 上传用户:lgs0519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,人们在日常生活中也在不断创造并分享着各种多媒体素材。面对网络中量级日益增长的海量多模态数据,传统的单模态检索已经逐渐不能满足用户的需求。如何使计算机正确理解多模态数据之间的语义关联进而实现跨模态检索,已经成为多媒体理解领域的重要研究课题。为此,本文利用语义和常识信息围绕跨模态图像文本检索任务开展了深入的研究工作,其中主要的创新性研究成果如下:(1)提出了一种堆叠式多模态注意力网络用于跨模态图文检索任务。该算法利用堆叠式注意力机制,通过联合使用单模态信息和多模态语义信息作为作为指导,利用多步骤的注意力推理实现对细粒度跨模态关联的捕捉。此外,通过对匹配图文实例之间的距离施加约束,能够更好地保持公共空间中多模态数据的分布一致性。(2)提出了一种堆叠式放缩激活循环残差网络用于跨模态图文检索任务。首先,该网络将多种语义增强操作集成到表征模块中,通过模块的多层堆叠实现多层级特征的提取。此外,为捕捉多层次特征之间隐含的语义关联,提出一个跨模态语义差异约束,进而利用语义层级之间的关联性来缩小异构数据之间的分布差异。(3)提出了一种共识知识感知的视觉语义嵌入模型用于跨模态图文检索任务。通过统计图像描述语料库中语义概念之间的共现关联将共识知识(Consensus)建模为概念关系图,并将其与图卷积网络结合学习得到对共识知识敏感的概念表征。在此基础上,我们能够利用共识知识对多模态数据进行高阶语义概念的推断和表征,进而实现更精准的跨模态语义对齐。(4)提出了一种常识知识辅助的视觉语义嵌入模型用于跨模态图文检索任务。通过将知识图谱、统计关系与图神经网络相结合,同时实现对逻辑型常识知识和统计型常识知识的抽取,从而将多种常识知识融入到跨模态表征之中。以上方法均在两个公开基准数据集MSCOCO和Flickr30k上进行了测试,大量实验证实了本文所提四种方法的先进性。
其他文献
【目的】提升岑溪软枝油茶的春梢质量和促进花芽分化。【方法】以12年生岑溪软枝油茶为试验材料,于2021年3月春梢萌动前对油茶主枝分别进行环剥、环割和环扎处理,并设置对照。处理时和处理后每隔15 d分别采集处理部位上下皮部,测定可溶性糖、淀粉、全氮和有机碳含量;在春梢生长结束时测定春梢长度和基部直径,统计春梢数量,在现蕾期统计花芽分化率。【结果】环剥和环扎处理的油茶春梢长度均低于对照,其中环剥达到显
期刊
随着改革开放脚步日益加快,我国城市化建设的规模在不断扩大,为提高土地资源的利用率,高层建筑数量快速攀升。同时,高层建筑火灾已逐渐成为消防工作火灾防范的重点,然而高层建筑体量大、结构复杂、功能多样、人员密集,这给消防安全管理工作带来了极大的挑战。本文主要分析了高层建筑的特点,阐述了消防安全管理工作的意义,提出了优化高层建筑消防安全管理工作的措施。
会议
当前消防安全形势日益严峻,尤其是高层建筑消防安全更是引起了足够重视,本文综合分析了这方面存在的问题,从建筑防火设计和社会化监督管理等角度提出解决对策。
会议
With the urgent requirement of energy transformation and widespread deployment of information network represented by 5th generation mobile technology,the distributed resources are gradually merging fr
学位
当前,在教育数字化转型的背景下,各类信息技术手段逐渐融入教育教学,这为教师的专业发展提出了更高的要求。基于此,本文以促进高素质教师队伍建设为目的,采取文献分析等方法对教育数字化转型背景下的教师专业发展路径进行探索,并提出参考建议,即利用数字技术资源,加强专业学习;利用数字技术资源,促进专业改进;积极参与网络研修,提升专业素养;积极参与教学研究,提高专业水平;重视教学实践创新,实现专业发展。
期刊
油纸绝缘是特高压直流换流变压器阀侧绕组的主绝缘,其放电行为威胁直流输电系统的安全运行。目前,换流变压器油纸绝缘局部放电的相关研究主要在稳态条件下开展,无法为换流变压器的绝缘设计提供可靠的理论依据。本文基于换流变压器实际运行工况,建立了阀侧绕组油纸绝缘局部放电、水分含量和电场分布之间的关联关系,揭示了运行工况下换流变压器油纸绝缘局部放电机理,并提出了一种基于氧化锌磁控溅射改性的油纸绝缘局部放电抑制方
学位
大量抗生素在污泥中被检出,然而传统的污泥处理工艺如厌氧消化,不能有效去除抗生素。微生物电解池(microbial electrolysis cell,MEC)由于引入了新型的电活性微生物菌群和胞外电子传递过程,能够显著提高系统的生物降解效率。因此在本研究中构建单室MEC处理浓缩污泥,探究外加电压、运行温度和运行时长等因素对抗生素去除和抗生素抗性基因(antibiotic resistance ge
学位
本文从数字化教学资源的丰富性、教学方式的多样性、评价体系的完善与反馈机制的优化等方面探究了教育数字化转型对高中信息技术课程的影响,同时从多元智能理论、学习风格理论、知识结构与学习路径等方面阐述了个性化学习路径的理论基础,并提出了教育数字化转型推动个性化学习的实践策略,其中包括利用数字化资源构建多样化的学习内容、设计灵活的教学活动与任务、搭建线上线下结合的学习平台、建立个性化评价与反馈机制。
期刊
报纸
随着计算机辅助设计技术的飞速发展和新兴媒体的不断涌现,三维建模在智能制造、3D电影、3D动画、虚拟现实/增强现实和三维医疗等领域扮演着重要角色。面对数据与日俱增、种类多样的三维模型数据,如何智能地管理这些数据,已成为多媒体分析领域的研究热点。传统的三维模型检索主要使用文本关键词或者是三维模型作为输入,来实现相关模型的查询。然而,传统方法面临两大困难:一方面,文本标注主观性强,复杂模型无法用精简准确
学位