基于深度学习的大规模图像哈希检索研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:bands007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索技术旨在图像数据库中搜索与查询图像相似的图像,在诸如搜索引擎、电子商务、医疗系统等领域应用广泛。随着互联网的发展与数字设备的普及,图像检索数据库规模也迅速增长,导致检索时间效率降低。因此,人们提出了适用于大规模图像检索的近似最近邻搜索算法。哈希技术是近似最近邻搜索中的一类流行算法,其优点有运算速度快、储存空间小、检索效果好。传统的哈希算法将图像的手工特征映射为较短的二进制哈希码,且哈希码可保持原始空间的相似性。但是,手工特征只能反映图像的低层视觉特征,存在较严重的语义鸿沟问题。近年来,能反映图像高层语义的深度特征被运用到图像检索任务中,且取得了很好的效果。因此,人们将深度卷积神经网络与哈希学习整合为统一框架,提出了深度监督哈希技术。该技术减小了语义鸿沟,大幅提高了检索精度。现有的深度哈希技术大体可分为基于度量学习与基于分类的方法,前者通过大量二元、三元组学习样本间的语义关系,收敛困难但精度较高;后者将哈希学习嵌入在深度分类网络内,收敛速度快但精度难以保证。针对基于度量学习、分类两类方法中的一些不足,本文提出了相应的改进方法,以提高训练效率、提升检索精度。本文的主要贡献总结如下:(1)提出了基于度量学习的深度多负例监督哈希算法。现有基于度量学习的深度哈希方法中只保证二元组、三元组内样本的相似性,未能充分利用监督信息,导致检索精度较低、收敛速度较慢。针对该问题,本文引入多负例学习方法,即同时保持查询图像与相似图像(正例)、多个不相似图像(负例)间的语义关系。首先,提出了基于样本复用的多负例元组构建方法,可在一个训练批次内利用较少的样本获得足够的多负例元组。基于多负例元组提出多负例哈希损失函数,以使查询样本与多个负例在训练时能同时交互。因此,该方法在训练过程中能更充分地利用监督信息,提高检索精度与学习效率。此外,在损失函数中加入间隔参数,以进一步扩大不相似本间的汉明距离,提高检索精度。(2)提出了基于分类的深度大间隔监督哈希算法。现有基于分类的深度哈希方法不能很好的控制不相似样本间的汉明距离,因此检索精度较低。本方法基于图像分类的框架与大间隔分类,分别提出了适用于单标签数据与多标签数据的大间隔分类损失函数。该损失函数能增大分类面间隔,使不同类样本哈希码间的距离尽可能大。另外,为了使同类样本间的哈希码间距离尽可能小,加入了中心损失项。因此,该方法能更好地控制图像哈希码的类间距离与类内距离,从而有效提升检索精度。另外,该方法由于采用了分类的框架,因此有较快的收敛速度。本文在多个基准数据集上进行了大量实验,结果表明与其它先进深度监督哈希算法相比,本文所提算法在检索效果、训练效率上具有明显的优势。另外分析了不同深度卷积神经网络、超参数对算法效果的影响,并确定了最优超参数。
其他文献
越南实行开放政策以来,中越两国之间的文化交流更加密切,越来越多的中国电视剧在越南转播,观众对电视剧越译版的准确性要求也越来越高。本人作为越南人,在观看中国电视剧越译版的时候,也发现比较多关于“忠实度”的翻译问题,比如词与词之间的意义忠实度。本文以中国电视剧《西游记》(越译版)为基础,主要从两个角度对该部电视剧中实词翻译的忠实度进行考察和分析:一是意义忠实度;二是功能忠实度。本文由五个章节组成:第一
近些年来,伴随电子器件朝着高性能化和微型化的方向发展,人们对高性能介电材料的需求变得更加迫切。传统陶瓷介电材料韧性较差且需要高温烧结,已经很难满足介电材料的性能要求。相比之下,聚合物基介电复合材料具有良好的机械性能、很高的击穿强度以及价格低廉等优势,在电子电器领域有着极高的研究价值和广阔的应用前景。将碳化硅(Silicon carbide,SiC)、钛酸钡(Barium titanate,BT)等
在经济的飞速发展下,道路上的机动车数量急剧增加,因疲劳驾驶导致的事故也时常发生,基于脑电,心电的检测方法需要佩戴特殊的状态不利于用户体验,设备价格昂贵不利于普及,而针对眼睛,或者针对打哈欠的检测方法不仅方法复杂并且太过单一,不能够较为全面的检测驾驶员的疲劳状态。针对此问题,本文致力于将基于卷积神经网络的人脸识别算法应用于本文的研究中来,进而研究眼部及嘴部的定位方法及识别方法,研究如何融合多源的行为
近年来政府机构改革步伐加快,各部门权责重新划分,改革中不断强调的一点就是简政放权,建设服务型政府,让政府真正为人民服务。本文通过对相关资料的查阅,综合国内外研究现状,
近年来,众多学者都在尝试利用斑马鱼这种模型生物进行神经发生以及神经损伤修复的研究。转录因子Gata3以及Neurog1被证实在斑马鱼新生神经元的增殖,分化以及迁徙中扮演重要角
脑瘤是世界上死亡率最高的疾病之一,恶性脑肿瘤患者的存活时间不超过两年。准确定位和判断脑瘤患者的肿瘤区域和类型对诊断和制定治疗方案非常重要。因为MRI技术可以对人体的软组织进行高分辨率和高对比度成像,同时还可以进行大视野、多方位的观测,所以MRI技术被广泛地使用在脑瘤的临床诊断中。传统的人工分析图像的方法无法满足现代医学诊断的要求,所以迫切地需要开发可靠的自动化MRI脑瘤图像分割的方法。随着深度学习
针织产品使用广泛,涉及许多行业,但是针织物的卷边会带来弊端,卷边问题直接影响到织物的存放、染色和缝纫等,是亟需解决的技术难题。本文探讨一种新的防卷边工艺,即在针织物的边部涂胶,通过改变涂胶后针织物边部的弹性性能来抑制针织物的卷边情况。本文首先在纬平针织物线圈解析式的基础上,采用均匀化理论,预测针织物与涂胶针织物的弹性性能。然后采用数值模拟技术,比较不同涂胶参数对边部涂胶针织物曲褶变形的影响,最后采
随着经济社会的不断发展,现代公民的民主意识和参政意愿逐渐增强,许多公民在网络上浏览各地政府工作报告和领导讲话文件,对一些政府政策的制定实施及社会现象都会通过网络发
力致荧光变色材料是一种会对外界施加的压力或者剪切力产生响应,使材料的荧光发射性质发生明显变化的材料。这种具有特殊性质的材料无论在基础理论研究或是应用方面都有着良好的前景。但传统的荧光材料,在聚集态下会发生聚集荧光猝灭,从而降低材料的荧光强度。但在实际应用中,荧光材料大多数情况下处于固态,聚集荧光猝灭性质为荧光材料的应用带来了很大的不便。而唐本忠教授发现的聚集诱导发光效应,为制备固态高效发光材料提供
新HSK四级作为汉语学习由初级向高级过渡的重要阶段,是考查学习者是否具备日常学习和工作基本交际能力的重要尺度,同时也是非洲地区申请孔子学院奖学金的必要条件。新HSK四级考前培训是教学最后阶段最重要的一环,但在学生学习及其教学效果等方面却一直存在着诸多问题,比如,学生缺勤严重、课堂积极性不高、做题正确率低、成绩提高缓慢等。造成这些问题的原因主要是教学方法单一;教学内容不够丰富,缺乏针对性;教学环节缺