论文部分内容阅读
随着互联网与信息技术的发展,图像数据规模增长迅速,如何在大规模的图像数据中快速并且准确地找到用户感兴趣的图片成为信息检索领域研究的热点。传统的基于内容的图像检索算法主要根据图像本身内容特征进行检索匹配,这些算法主要的缺点是特征维度高,存储空间大,检索效率低下。哈希学习通过将图像高维特征映射为二进制码串,不仅降低了数据的维度,还减少了图像数据的存储空间,提升了图像检索系统运行的效率。但是传统哈希学习的方法都是采用图像的手工特征来进行哈希函数的学习,这些手工特征是用非监督的方法提取的,并不能很好的保留图像之间的语义相似性。不仅如此,这些方法把特征提取和哈希函数学习两部分割裂开来,导致最后学习的哈希码检索精度不高,针对这些问题,本文主要工作如下:设计了一个端到端的基于语义保留的深度哈希学习网络结构,将深度卷积神经网络同时用于图像特征提取和哈希函数学习。与人工设计的特征相比,深度卷积神经网络提取的特征更能够保留图像之间的语义相似性。针对哈希学习任务设计了自适应权值的损失函数,减少了正负样例不平衡对于检索性能的影响。同时给损失函数加上一个二值约束正则项,减少了量化所带来的误差,避免了传统方法因为“松弛”策略而导致的信息损失。添加语义保留层,利用数据监督信息对图像语义的表示作用,优化哈希码的生成,使得到的哈希码更能够保留语义相似性,提升检索精度。针对图像数据集有标签数据量少,且获取代价高;而无标签数据量大,易获取却无法被利用的问题。在深度哈希学习中引入生成对抗网络,设计了基于生成对抗网络的半监督哈希学习网络,在网络输入层之前添加一个生成器,用于生成“虚假”图片。这样有标签和无标签样本都可以被视为“真实”样本,生成器生成的样本视为“虚假”样本。将哈希网络作为判别器,并在输出层上加入一个判别节点,对真假样本进行判别。该网络充分利用了无标签数据,提升了哈希网络的性能。为了验证算法的有效性,针对算法的每个创新点在多个公开数据集上进行检索对比实验,实验结果表明这些创新点都能够提升图像检索的准确率。同时将这些创新点结合,与经典的哈希算法对比,实验表明该深度哈希学习算法相比于目前的哈希方法在图像检索中有更好的效果。