论文部分内容阅读
得益于存储开销与检索效率上的优势,基于哈希学习的近似最近邻搜索算法已被广泛地应用于大规模图像检索。近年来,由于计算机算力的提升、更好的优化算法以及大规模图像数据集的出现,深度卷积神经网络得到了空前的发展,展现出了对图像数据的强大表示能力。相较于传统的采用手工特征作为模型输入的哈希学习方法,端到端的深度哈希学习可以将特征表示与哈希编码联合起来同时进行学习,极大地改善了哈希编码的检索性能。为了充分地挖掘深度卷积神经网络的潜力,本文针对无监督和有监督这两种不同的应用场景分别各提出了一个端到端的深度哈希学习模型:1)基于伪成对标签的深度无监督哈希学习。目前主流的深度哈希学习方法多为有监督学习,无监督的深度哈希学习则由于缺少相似性监督信息,而难以获取高质量的哈希编码。在实际应用中,为数据添加标签是一项极其费时费力的工作,而且对于一些特定的领域,往往还需要领域内专家的参与才能完成标记工作。为此,本文提出一种端到端的基于伪成对标签的深度无监督哈希学习模型。它的学习过程包括两个阶段:第一个阶段利用预训练的深度卷积神经网络所提取出的包含丰富语义信息的图像特征来构造数据的伪成对标签;在此基础上再于第二阶段进行端到端的基于成对标签的有监督哈希学习。在基准图像数据集上的实验表明,该模型的图像检索性能领先于主流的深度无监督哈希学习模型。2)面向高效图像检索的深度汉明嵌入哈希。深度卷积神经网络所学习到的图像特征表示具有非常明显的层次结构。随着层数的加深,它所学习到的特征更加抽象、类的判别性也逐渐增强。基于此特点,本文提出一种新颖的可直接依托于现有深度图像分类网络的哈希编码方式,即首先在深度卷积神经网络的末端插入一层潜在层,随后再依据每个单元的激活情况来获得图像的哈希编码。同时根据哈希编码本身的特征提出了一种汉明嵌入损失用于直接控制数据之间相似性信息的保留。在基准图像数据集上的实验表明,相较于其它的深度哈希学习方法,该模型能明显提升图像检索性能,且尤其对短编码下的检索性能改善效果显著。