基于深度学习的图像检索研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lycan95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于移动互联网的飞速发展,特别是Flickr、Facebook等立足于社交的网站的流行,图像、视频等异构数据在互联网上的占比越来越重。目前,社交网站Facebook上超过10亿的注册用户每月会生产超过10亿张图像的数据;而图片社交网站Flickr的用户仅2015年就上传了多达7.28亿张的图像,平均每天约为200万张;而在中国,全国最大的电子商务系统淘宝网,在后端保存着超过286亿张图像数据。基于以上的现实,如何在具有大量的包含有丰富视觉信息的图像库中快速、准确地检索并返回用户感兴趣或需要的图像,是目前多媒体信息检索领域的研究热点。在图像检索中常常存在视觉数据中提炼出的信息与在特定场合下这些数据对用户的解释之间缺乏一致性的现象,这个现象被称作语义鸿沟,语义鸿沟是图像检索中难以忽视的问题。基于此本文的工作主要集中在以下部分:(1)本文分析了近年来图像检索技术的研究现状,在此基础上探讨了语义鸿沟问题产生的原因。本文认为描述图像的标签之间存在的非独立关系导致了语义鸿沟问题,解决这个问题需要学习图像的语义嵌入,而图像的语义嵌入即图像的语义信息。(2)提出基于图像多目标语义的图像检索算法。本文通过构建一个深度卷积神经网络从图像中检测提取多个目标的类别和位置信息,并在对信息进行筛选和融合后通过基于递归神经网络的序列生成模型生成图像所属的分类。通过比较图像分类的相似程度来对图像进行排序,实现检索任务。(3)考虑到不同层次的图像语义对检索的影响,本文尝试使用图像概念语义替代多目标语义,研究基于概念语义的图像检索算法。具体的实现方法是首先通过图像摘要和句法分析任务,从图像中提取关系短句作为概念语义内容,然后通过基于注意力机制的序列生成模型生成图像所属的类别,通过比较类别相似程度对图像排序。(4)本文在多个数据集上对两种图像检索方法进行训练和测试,分别测试了在图像单标签检索和多标签检索中的性能,结果显示本文实现的检索方法相比于过去的检索方法具有一定的优势。
其他文献
强电磁脉冲能量通过小孔、缝隙等耦合到计算机机箱内,会对计算机产生干扰和破坏作用。本文应用时域有限差分法模拟了电磁脉冲对计算机机箱的耦合透入过程,通过分析机箱中电磁
基于我国消防法律法规日益完善的背景下,消防法制建设随之取得了显著性的成效。但是,消防监督管理工作仍然存在诸多需要解决的问题,并且这些问题对于我国消防法制建设具有一
为了解决桩基施工过程中出现的一些质量通病,结合内蒙古京泰电厂原煤仓桩基施工过程中遇到的问题,采用现场统计和理论分析的方法,提出混凝土灌注桩几种常见质量通病的防治及
最高院颁布的“法官枉法、院长辞职”的规定本质上是在法院推行行政首长负责制,这一举措赋予了法院院长凌驾于合议庭甚至是审判委员会之上的权力,使得法院院长可以也不得不按
跨栏运动对少年运动员的身体条件、身体素质有较高要求,有些身体素质对运动成绩起决定性的作用,如速度、耐力、力量、柔韧性和协调性等。根据跨栏跑运动项目的特点和少年的生
石油是一种不可再生资源,目前原油的质量日益变劣、变重,而对轻质燃料汽、柴油以及石油化工产品丙烯、乙烯等的需求逐年增多,加之环保法规的日益严格,使得炼油企业所面临的压
本文通过研究相关适航规章的要求,提出民机研发领域工程委任代表管理体系的架构、内容、建立模式,以及工程委任代表的申请授权、培训、动态管理和工作模式及过程,以期更有效
<正>扶贫要实事求是,因地制宜。要精准扶贫,切忌喊口号,也不要定好高骛远的目标。三件事要做实:一是发展生产要实事求是,二是要有基本公共保障,三是下一代要接受教育。各级党
<正>中国画以"线"为生命纲纪,一切画面的形式语言都是在"线"的力量、速度、墨色等因素组构所形成的线质基础上建立起来。远古的拙刻朴质、秦汉壁画、帛画的璃纹丹彩、魏晋人
建模与仿真技术是21世纪信息技术和制造技术结合的桥梁,是使企业产生最大经济效益的核心技术,也是21世纪制造业的一项关键支撑技术。阐述了建模与仿真技术在制造业的地位和作