基于深度哈希学习的大规模图像检索技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wcd_soft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网与信息技术的发展,图像数据规模增长迅速,如何在大规模的图像数据中快速并且准确地找到用户感兴趣的图片成为信息检索领域研究的热点。传统的基于内容的图像检索算法主要根据图像本身内容特征进行检索匹配,这些算法主要的缺点是特征维度高,存储空间大,检索效率低下。哈希学习通过将图像高维特征映射为二进制码串,不仅降低了数据的维度,还减少了图像数据的存储空间,提升了图像检索系统运行的效率。但是传统哈希学习的方法都是采用图像的手工特征来进行哈希函数的学习,这些手工特征是用非监督的方法提取的,并不能很好的保留图像之间的语义相似性。不仅如此,这些方法把特征提取和哈希函数学习两部分割裂开来,导致最后学习的哈希码检索精度不高,针对这些问题,本文主要工作如下:设计了一个端到端的基于语义保留的深度哈希学习网络结构,将深度卷积神经网络同时用于图像特征提取和哈希函数学习。与人工设计的特征相比,深度卷积神经网络提取的特征更能够保留图像之间的语义相似性。针对哈希学习任务设计了自适应权值的损失函数,减少了正负样例不平衡对于检索性能的影响。同时给损失函数加上一个二值约束正则项,减少了量化所带来的误差,避免了传统方法因为“松弛”策略而导致的信息损失。添加语义保留层,利用数据监督信息对图像语义的表示作用,优化哈希码的生成,使得到的哈希码更能够保留语义相似性,提升检索精度。针对图像数据集有标签数据量少,且获取代价高;而无标签数据量大,易获取却无法被利用的问题。在深度哈希学习中引入生成对抗网络,设计了基于生成对抗网络的半监督哈希学习网络,在网络输入层之前添加一个生成器,用于生成“虚假”图片。这样有标签和无标签样本都可以被视为“真实”样本,生成器生成的样本视为“虚假”样本。将哈希网络作为判别器,并在输出层上加入一个判别节点,对真假样本进行判别。该网络充分利用了无标签数据,提升了哈希网络的性能。为了验证算法的有效性,针对算法的每个创新点在多个公开数据集上进行检索对比实验,实验结果表明这些创新点都能够提升图像检索的准确率。同时将这些创新点结合,与经典的哈希算法对比,实验表明该深度哈希学习算法相比于目前的哈希方法在图像检索中有更好的效果。
其他文献
盾构法施工是一种施工效率高且对环境影响小的隧道施工方法,管片是盾构隧道的长期受载体,其质量直接关系到隧道的安全.选用ANSYS中shell63单元建立盾构管片模型,对模型加载后
研究背景肝脏移植是解决终末期肝病的有效方法,但移植后可能存在的急性排斥反应仍然是导致早期移植物失功的重要原因。两个多世纪以来,人们一直用Th1或Th2细胞学说来解释大部分
小型人工湖由于水域面积狭小、水体循环缓慢等特点,使得进入其中的污染物难以降解,容易引发水体富营养化等水环境恶化问题。为探析小型人工湖泊藻类动态变化特征及主要驱动因
目的研究磷酸肌酸(Phosphocreatine, PC)对风湿性心脏病患者在体外循环(cardiopulmonary bypass, CPB)下行瓣膜置换术的心肌保护作用,探讨其围手术期减轻心肌缺血/再灌注损伤
简介了船舶行业新造船可剥离涂料的试用背景。通过对可剥离涂料在船厂样板进行试验及实船试用,考察了该涂料的施工方式、施工性能、焊接性能、保护性能及剥离性能,探索了实船
针对公路隧道施工系统安全的特殊性,提出并建立了公路隧道施工安全评价体系。同时公路隧道施工安全系统是一个复杂的非线性系统,运用BP神经网络对公路隧道施工系统进行了安全
背景:镇静(意识消失)、镇痛(抗伤害性应激反应)和肌松(肌肉松弛)是全身麻醉的主要组成成分。只有同时使全身麻醉的各个成分都达到合适的状态,才能获得理想的平衡的麻醉深度。
性取向是指个体对不同性别的人产生的心理或行为方面的差异性偏好,按照偏好对象的不同,可以将性取向分为异性恋、同性恋、双性恋和无性恋。它成为了国内外各个研究领域关注的热
唐诗宋词从素材来源、意境营造、情感把握以及语言风格等方面,为流行歌曲的歌创者提供了很多好的思路和借鉴,这就使得流行歌曲对唐诗宋词的精华加以借鉴和发扬,但同时二者毕
目的:通过对膝关节骨性关节炎(Knee OA)患者关节软骨IL-6基因启动子区甲基化状态及IL-6蛋白表达的检测,探讨IL-6基因启动子区的异常甲基化在膝关节OA发生、发展中的作用。方法