基于深度学习的大规模图像检索技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:aidilj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索是多媒体领域一个非常活跃的研究方向。作为一种直观、生动的信息载体,图像数据已经深入渗透到了我们的日常生活中,成为人们沟通、交流的重要手段。目前,图像检索已经在医学、军事、安防、娱乐等领域取得了广泛的应用。将图像数据有效地组织起来,供人们浏览、搜索,具有重要的社会意义和巨大的市场需求。随着互联网技术的飞速发展,特别是数码相机、智能手机等移动设备的普及,图像数据呈现出爆炸式增长。对海量图像内容进行检索,面临着新的挑战。其中最为关键的一个问题是图像的低层特征与人们的高层认知理解之间存在“语义鸿沟”。  近几年来深度学习在图像分类与目标检测方面取得了突飞猛进的发展,而在图像检索方面鲜有应用研究。本文引入深度神经网络来学习适用于图像检索的层次化特征表达,并研究了以此为基础的特征匹配技术,以解决“语义鸿沟”问题。针对高维层次化视觉特征在大规模图像检索中带来的维度灾难问题,本文还研究了相应的高维索引技术。具体而言,本文紧紧围绕大规模图像检索中的特征提取、特征匹配以及高维索引三个方面展开深入研究,取得了以下研究成果:  1.基于深度神经网络的层次化特征学习  针对传统图像特征提取方法得到的低层特征无法有效反映高层语义的问题,本文主要研究了基于深度神经网络的层次化特征提取方法。现有基于深度卷积神经网络的特征学习方法大都是有监督的,需要大量的类别标注信息。然而,在大规模图像检索中,通常缺乏类别标注信息。因此,本文提出了一种基于弱标注数据的特征学习方法,利用图像之间的相关与不相关关系构建三元组进行特征学习。由于这种基于相关关系的弱标注信息比较容易获取,避免了费时费力地进行类别信息标注,因而非常适合于大规模图像检索。此外,在有类别标注的情况下,该方法也可以结合类别信息进一步提高检索精度。实验结果验证了该方法的有效性。  2.基于在线排序学习的层次化特征匹配  通常,多种视觉特征互为补充,较单一特征具有更好的检索性能。本文提出了一种基于排序学习的多特征融合框架,利用现有的批量排序学习方法融合多种特征(特别是深度学习得到的层次化特征)生成排序模型进行特征匹配。但是,批量学习方法需要所有数据参与训练,无法在线更新排序模型。为此,本文进一步提出了一类在线排序学习方法。在线学习方法每次仅利用一个样本进行训练,与批量学习相比,具有更高的时间和空间效率,并且可以实时更新排序模型,以适应用户查询需求的动态变化。实验结果表明:与批量学习相比,在线排序学习方法能在保持检索精度基本一致的情况下显著提高排序模型的训练效率。  3.高维层次化特征的压缩与索引  通常深度卷积神经网络学习出来的层次化特征高达上千维,在大规模图像检索中会带来维度灾难问题。为此,本文研究了层次化特征的压缩和索引方法。本文研究了基于谱哈希和积量化的层次化特征压缩技术,并提出了一种自适应的二进制码多索引哈希方法。该方法通过分析二进制码比特位之间的相关性来划分子串,以构建分布更为均匀的哈希表,从而提高检索速度。实验结果表明,该方法相比传统的多索引哈希方法能显著提高检索速度达50%。在此基础上,我们开发了一个开源的高维索引库,能以极低的空间和时间代价在高维空间完成近似最近邻查找。
其他文献
随着视频编解码技术的不断发展,高清视频应用的日益普及,人们对视频的清晰度和流畅度的需求也变得越来越高。高清晰度视频编码解码处理是数据密集和计算密集的计算,计算机系
秘密共享是数据保密和信息安全的一种重要手段,能够防止重要秘密信息及数据的丢失、毁坏和恶意利用。(t,n)门限秘密共享是秘密共享技术中最常见的一种实现方法,它将共享秘密分成
自2007年以来,云计算是目前国内外商业和科研机构研究的热点之一,它是一种通过互联网将数据中心的各种资源打包成服务向外提供的商业模式。一些IT商业巨头把云计算作为其未来发
分支互模拟等价关系是由van Glabbeek和Weijland提出的进程等价关系。分支互模拟对内部动作采用比较合理的抽象处理,对进程的分支性质作了精确的刻画,是所有合理的语义等价中最
随着计算机和信息技术的发展,软件和硬件环境均发生了巨大的变化。在现实社会中具有数字通信能力的设备越来越多,这些设备的信息和功能可以被其它的设备使用,这就导致了不同类型
近年来,随着数字媒体技术和互联网的快速发展,数字媒体的应用取得了惊人的进展。数字媒体的知识产权保护及其真实性、完整性的认证等问题也已成为人们关注的焦点。其中利用数字
随着信息时代的到来,高速的数据传输使并行的ATA技术的缺陷越来越明显,而串行ATA技术以其支持热插拔、传输速度快的优势在硬盘领域得到广泛的应用。为了提高了数据传输的可靠性
图像信息生动、直观,相比于文字媒体,包含了更多的信息量。信息技术的发展,多种显示设备的更新换代,更使之成为人类描述客观世界的有效手段之一。但正由于图像的这种特点,使
随着信息技术的高速发展,信息安全问题日益突出,得到了社会各个领域的高度关注。面对纷繁复杂的各种攻击手段,信息安全专家沈昌祥院士指出,操作系统安全是整个信息系统安全的基石
谱方法是一种重要的高性能数值计算方法,有着有限元方法和有限差分法不可比拟的优势,其最大的魅力是在原方程的解无穷光滑时,该方法具有“无穷阶”的收敛速度和逼近精度。而谱元