基于场景语义结构图的图检索的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zxw123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和信息技术的高速发展,互联网平台上积累了海量的数字图像数据,这些海量的图像数据中潜藏着许多有价值的信息,如何从这海量图像数据中快速、准确的检索出满足用户需求的图像数据是当今时代非常重要的一个研究方向。本文构建了一个场景语义结构图检索系统,并在场景语义结构图检索的基础上实现了基于语义的图像检索,本文构建的场景语义结构图检索系统包含了召回、粗排、精排这三个阶段。在召回阶段,本文提出了基于motif的场景语义结构图召回算法,借助该算法可以在场景语义结构图数据库中召回和询问场景语义结构图相关的场景语义结构图得到一个场景语义结构图候选集。该算法用结构简单、稳定的motif来表示场景语义结构图,通过motif的检索来实现场景语义结构图的召回。为了计算motif在语义上的相近性,本文引入word2vec通过词向量来计算motif中各个部分的语义相似性。在该算法中还定义了三个匹配阈值来控制该算法的召回要求,可以根据实际需求来调整这三个匹配阈值召回满足实际需求的场景语义结构图。在粗排阶段,本文提出了一个场景语义结构图匹配距离度量函数(scene graph matching distance,SGMD),该函数用于对召回阶段得到的场景语义结构图候选集合进行快速粗略的排序。对场景语义结构图候选集进行粗略排序后,保留排在前面的结果,过滤掉排在后面的结果,进一步精简候选集,得到初步的检索结果。在精排阶段,本文通过图神经网络来对精简后的候选集进行精确排序得到最终的检索结果。图神经网络通过从数据中训练学习场景语义结构图的表示,把复杂的场景语义结构图映射到低维向量空间中。把困难的场景语义结构图相似性计算问题转化为简单的向量相似性计算问题。本文设计的图神经网络主要包含三个部分:信息编码部分、信息传播部分、信息聚合部分。信息编码部分的作用是对场景语义结构图中的物体信息和关系信息进行编码,从中提取高阶特征,让图神经网络能更好的表示场景语义结构图中的信息。信息传播部分让信息在图内甚至图之间传播,使每个物体都能学习到周围一阶甚至高阶信息。信息聚合部分聚合所有的物体的表示信息,让图神经网络最终能用一个向量来表示场景语义结构图的结构信息和语义信息。本文在实验部分,通过和其它算法进行对比,以及可视化分析,证明了本文构建的场景语义结构图检索系统具有优异的检索性能,不仅能检索到和询问场景语义结构图精确匹配的场景语义结构图,而且还能检索到和询问场景语义结构图语义相似的场景语义结构图,能够很好的满足场景语义结构图的实际检索需求。
其他文献
金属板带材是冶金工业的主要产品之一,广泛应用于家电、军事和化工等支柱行业。表面质量是板带材的关键质量因素之一,传统基于机器视觉的表面缺陷检测算法存在检测效果不够理想、检测速度较慢、推广性能差和适应性差等不足。因此有必要研究智能自动化缺陷检测算法来提高缺陷检测的效率及准确率。本文以金属板带材表面缺陷为研究对象,将深度学习领域中的深度卷积神经网络(Deep Convolutional Neural N
金属氧化物半导体纳米材料因其具有独特的物理和化学性质而在气敏传感器领域里有着深入的研究和广泛的应用。众所周知,材料的性能很大程度上取决于其晶粒尺寸和微观形貌,因此我们需要深入研究金属氧化物纳米半导体气敏材料结构、形貌与其气敏性能之间的内在联系,进而从调控材料的晶粒尺寸和微观形貌入手,探索提高材料气敏性能的可靠途径。本论文采用水热法制备了BiVO_4材料,探究了Bi(NO_3)_3水解形式以及添加表
改革开放四十年来,我国经济发展迅猛。但是随着经济发展,环境问题日益凸显,已经成为阻碍我国经济可持续发展的重要因素。因此,如何在发展经济的同时保护环境已成为我国新时期经济发展所面临的重要考验之一。企业作为社会经济的主体,在促进社会经济发展和居民就业的同时,也导致了严重的环境资源破坏问题。为了降低企业污染,促使其履行环保责任,除了行政约束,还可以尝试运用经济手段。绿色信贷政策要求银行严格控制高能耗,高
港口是物流链的枢纽之一,对地方经济及产业布局有着决定性影响。近年来,随着港口行业发展建设,国内港口行业呈现产能过剩、投资庞大、竞争激烈的发展态势,各地港口发展逐渐回归于周边腹地,对于区位优势不利的A港油品公司产生一定冲击。但与此同时,东北老工业基地振兴、“一带一路”战略、港口整合趋势,以及新能源产业发展,也给A港带来了前所未有的发展契机,如何在新形势下及时做好战略转变,是A港油品公司当下面临的重要
生产调度是智能制造系统中管理决策和资源分配的关键环节,采用高效的调度方法可有效提升企业生产效率,实现节能减排。柔性作业车间调度问题是一类典型的生产调度问题,广泛存
图像描述生成是计算机视觉、自然语言处理和人工智能领域中的一项重要研究课题,在人机交互、医疗视障辅助、智能安防预警、社交影像娱乐等新兴应用中受到了广泛关注。图像描述生成旨在理解并提取自然图像中的语义信息,并用如同人类描述一般准确流畅、生动形象的语言刻画出来。然而,由于图像场景丰富、内容对象多样、目标关系复杂,因此,如何对场景进行有效感知、对内容精准识别、对目标关系精确描述,以及生成准确、流畅且优美的
轻型运动通航飞机具有机动灵活、快速高效的特点,私人运动及培训市场潜力巨大,私人空中运动飞行体验和飞行培训对运动通航飞机机动性能和安全性提出了更高的要求。相应地,在制造工艺和材料水平不断提高的背景下,实现装配过程的自动化进而提高通航飞机装配质量有了可能。装配质量是决定飞机服役安全可靠的最后环节,如何获得装配质量最优的装配工艺至关重要。针对XF21型号飞机制造中,传统人工难以满足对接机身和机翼装配质量
TETRA无线通信专网具有高效、简洁、高稳定性等关键通信系统特有的优势,能够给用户提供日常工作所需的大量语音调度指挥功能。随着TETRA标准的不断修订,TETRA网络已经在我国全国各行业中有大规模部署,这对TETRA系统维护与测试有很高的要求,为了节省测试成本,提高系统质量,急需一套专业的TETRA测试系统。论文设计并实现了 TETRA数字集群测试系统中LLC和MLE协议栈,并完成了整体测试系统的
目的:建立同时测定SD大鼠血浆中4个内源性化合物浓度的LC-MS/MS分析方法,并进行方法学全验证,为毒代动力学生物样品分析提供方法学支持。方法:内源性分析物含量检测最大的挑
会议
改革开放40余年,特别是近20年来,政府深化改革,由“全功能政府”向“服务型政府”转变,市场成为资源配置的主角,极大的激发了全社会智力资源和创造力,民营经济得以快速发展,并成为国民经济的重要组成部分。家族式民营企业在我国民营企业占有90%的比例,是民营经济的主要形式,他们的成长与健康对民营经济至关重要。高层管理团队是企业经营的中枢,它从发展战略、企业经营、组织管理、运行监督、风险管控等多方面影响着