基于深度哈希学习的图像检索方法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:jay1222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于存储开销与检索效率上的优势,基于哈希学习的近似最近邻搜索算法已被广泛地应用于大规模图像检索。近年来,由于计算机算力的提升、更好的优化算法以及大规模图像数据集的出现,深度卷积神经网络得到了空前的发展,展现出了对图像数据的强大表示能力。相较于传统的采用手工特征作为模型输入的哈希学习方法,端到端的深度哈希学习可以将特征表示与哈希编码联合起来同时进行学习,极大地改善了哈希编码的检索性能。为了充分地挖掘深度卷积神经网络的潜力,本文针对无监督和有监督这两种不同的应用场景分别各提出了一个端到端的深度哈希学习模型:1)基于伪成对标签的深度无监督哈希学习。目前主流的深度哈希学习方法多为有监督学习,无监督的深度哈希学习则由于缺少相似性监督信息,而难以获取高质量的哈希编码。在实际应用中,为数据添加标签是一项极其费时费力的工作,而且对于一些特定的领域,往往还需要领域内专家的参与才能完成标记工作。为此,本文提出一种端到端的基于伪成对标签的深度无监督哈希学习模型。它的学习过程包括两个阶段:第一个阶段利用预训练的深度卷积神经网络所提取出的包含丰富语义信息的图像特征来构造数据的伪成对标签;在此基础上再于第二阶段进行端到端的基于成对标签的有监督哈希学习。在基准图像数据集上的实验表明,该模型的图像检索性能领先于主流的深度无监督哈希学习模型。2)面向高效图像检索的深度汉明嵌入哈希。深度卷积神经网络所学习到的图像特征表示具有非常明显的层次结构。随着层数的加深,它所学习到的特征更加抽象、类的判别性也逐渐增强。基于此特点,本文提出一种新颖的可直接依托于现有深度图像分类网络的哈希编码方式,即首先在深度卷积神经网络的末端插入一层潜在层,随后再依据每个单元的激活情况来获得图像的哈希编码。同时根据哈希编码本身的特征提出了一种汉明嵌入损失用于直接控制数据之间相似性信息的保留。在基准图像数据集上的实验表明,相较于其它的深度哈希学习方法,该模型能明显提升图像检索性能,且尤其对短编码下的检索性能改善效果显著。
其他文献
随着移动通信的飞速发展,移动网络中接入的智能设备数量与日俱增,对于网络承载能力和容量的要求也越来越高。各种服务和移动应用对于实时性的高要求,使得移动数据网络面临着
目前,我国的尾矿难以得到综合利用,利用率仅有7%,其中的大量有用元素被浪费,难以得到有效循环使用。由于鞍山地区的尾矿中硅含量和铁含量比较高,利用铁尾矿制备尾矿微晶玻璃,
随着现代科技的不断发展,显微设备以其超高分辨率在人类认识微观世界中发挥了巨大作用。然而,在图像采集与记录过程中,由于设备暗电流、样品物理性质以及操作人员的主观判断
精准农业是一种现代化农业理念,能够提高生产、减少投入,实现农产量的最大化、资源利用的合理化、环境污染的最小化,从而达到改善传统农业缺点的目的。无线传感器网络是实现
近年来随着电子商务的飞速发展使得越来越多的网络用户习惯在网络上发表自己对于某一事物的意见与评论,对这些评论所包含的情感倾向进行分析与判别可以创造巨大的商业与社会
近些年来,无线通信迅速发展的同时人们对数据业务的要求也越来越高,更大的数据量更快的传输速度对无线通信技术都提出了更高的要求。但无线信道完全开放的特性和存在衰落、覆
近年来人工智能和网络通信技术逐步发展,视频监控和图像处理技术的应用范围也相应扩大。传统的监控设备大多采用单一波段、固定位置摄像机,监控范围较小,在天况较差时使用红
我国境内分布着诸多大型汞矿,如贵州万山汞矿、陕西旬阳汞矿等,多年以来汞矿的开采和冶炼活动对当地的生态环境造成了严重的破坏,环境污染问题成为首要解决的问题之一。目前,
可视化分析作为文献计量学领域的一种重要的研究方法,通过可视化分析软件可以将某一领域中的文献客观、形象的展示出来,以此来挖掘其潜在的信息。本研究以2008-2017年Web Of
目前,随着视频数据量的急剧增加,视频流量逐渐占据互联网流量的90%以上,如何使计算机自动高效地利用视频中的有用信息,也随之成为了学术研究热点。在丰富众多的视频中,以人的