基于深度学习的视频图像检索的哈希方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：mqkxxmvo

【摘要】

：

随着近年来不断发展的存储及通信技术,互联网上的信息量不断呈现爆炸增长,尤其是图像视频等多媒体信息。这也使得图像视频等检索从原本的基于文本的检索转变为基于内容的检索

【作者】

：

陆徐超

【出处】

：

上海交通大学

【发表日期】

：

2004年期

【关键词】

：

图像检索卷积神经网络深度哈希方法视频检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着近年来不断发展的存储及通信技术,互联网上的信息量不断呈现爆炸增长,尤其是图像视频等多媒体信息。这也使得图像视频等检索从原本的基于文本的检索转变为基于内容的检索。为了提高图像视频等检索的准确率以及检索效率,许多研究者提出了各种模型来应对图像视频检索。深度哈希方法是目前的检索方法中研究最为活跃且效果最好的方法。所谓哈希即检索过程中的图像视频等都被表示成了低维二进制特征称为哈希码,且以汉明距离为衡量相似性的标准;所谓深度即将图像视频转换为哈希码的哈希函数的主体是由深度学习的网络如卷积神经网络构成的。目前的深度哈希方法将不相似图像的哈希码间汉明距离拉得不够开,导致准确率仍有提升空间。针对这个缺点,我们提出了一套基于深度学习的图像检索的哈希方法,其中的核心是目标哈希码生成算法以及适应于不同尺寸输入的两套深度网络。实验证明了我们的方法在现有方法的效果中处于领先。我们还将这套图像检索的系统加以改进推广到视频检索中并证明了其有效性。为了描述基于内容的多媒体检索的背景和研究现状,本文以图像检索为例,首先介绍了基于内容的图像检索的由来,发展演变以及高效算法需求的迫切性。我们先给出了图像检索方法的一般步骤,再引出在检索效率上更为高效的哈希方法。我们对哈希方法进行了详细的分类并介绍各个分类的特点。深度学习在计算机视觉领域的发展也使得图像检索的深度哈希方法获得了关注与成功。我们介绍了用于深度哈希方法的卷积神经网络的构成与细节,再对目前的图像检索的深度哈希方法作了概述和简介。深度哈希方法尽管是图像检索中效果最为突出的方法,但其仍有提升空间,需要有一个系统能够把不相似图像的哈希码间的汉明距离分得更开,使得检索更为准确。我们提出了一套基于深度学习的图像检索的哈希方法,我们的方法首先生成一套目标哈希码组,该码组是一套满足码组中的码字间的汉明距离最大化的精心优化的码组,它可以包含训练图像标签之间的语义信息。由该码组结合数据库图像的标签信息可以得到新的形式的训练数据,实现哈希网络的单例学习。我们的哈希网络基于卷积神经网络,最后一层是可以输出哈希码的哈希层。针对不同尺寸图像的输入,我们设计了两套结构不同的网络,可以根据数据集的特点和检索的需求灵活使用。为了验证我们提出的系统,我们在图像检索上用三个数据集MNIST,CIFAR-10以及ImageNet进行了图像检索的测试。我们的方法与十余种其他研究者提出的方法进行了比较。在检索的综合准确率MAP上,我们的方法在多个测试中都是最优,在ImageNet上,检索MAP更是提升了近10%。实验结果证明了我们提出的基于深度学习的图像检索的哈希方法十分有效。最后,我们还将整个系统进行改进以适应更为复杂的视频检索,我们加入了关键帧提取部分以及对关键帧哈希码取众数构成视频哈希码的步骤。我们在UCF-101数据集上作了实验,实验结果显示检索MAP可以达到0.9以上。这也证明了我们提出的检索系统不仅在图像检索中效果突出,在视频检索中也可以适用。

其他文献

化合物GA5对结直肠癌细胞DNA损伤/修复的影响及增敏Topo抑制剂机制的研究

[目的]探讨化合物GA5对DNA拓扑异构酶(Topo)的影响及机制,对Topo抑制剂的增敏作用。[方法]本研究以人结直肠癌细胞HCT116为模型:1、单细胞凝胶电泳技术检测GA5对DNA损伤的影

学位

化合物GA13315DNA拓扑异构酶DNA损伤应答化疗敏感性协同作用

液体衰减反转恢复序列血管高信号征联合灌注加权成像对急性前循环脑梗死的预后评估

研究目的磁共振液体衰减反转恢复序列血管高信号征(FVH)可用于判断脑梗死患者预后,但研究结果仍存在分歧,且未将脑梗死患者脑灌注与FVH联合进行分析评估。本研究探讨FVH联合

学位

磁共振成像脑梗死灌注加权成像FLAIR血管高信号预后

手性聚苯胺的合成方法研究

本文包括两部分内容,第一部分是通过优化自组装结合低聚物辅助法、界面聚合法、二次掺杂法的合成条件,得出每种方法下合成掺杂态聚苯胺的最优条件;第二部分是采用自组装结合

学位

手性聚苯胺掺杂态聚苯胺自组装结合低聚物辅助法界面聚合法二次掺杂法

starD7在AngⅡ诱导血管平滑肌细胞线粒体自噬中的作用及机制研究

血管紧张素Ⅱ（angiotensin Ⅱ,AngⅡ）对哺乳动物血压的调节至关重要,但是长期的高于生理浓度的AngⅡ刺激会对血管壁中层的血管平滑肌细胞（vascular smooth muscle cell,VSMC）造成

学位

线粒体自噬starD7线粒体-内质网接触位点AngⅡVSMC

全要素生产率视角下中国酒店业FDI溢出效应研究

在中国成为世界外商直接投资(FDI)第二大吸收国,跨国酒店业在中国持续扩张,社会消费结构逐渐转型升级,酒店业供给侧结构性改革步伐加快的背景下,全面深入地评估过去十多年来中国酒店业外资引进的成效具有重要而深远的意义。跨国酒店业在我国的直接投资,是否在全要素生产率的提升方面为我国内资酒店业的发展带来助力?这一过程受到了哪些影响因素的作用?外商投资酒店具体通过何种路径作用于我国内资酒店业的全要素生产率?

学位

酒店业外商直接投资溢出效应全要素生产率

Cur@Hb纳米颗粒对乏氧肝癌细胞放射敏感性的影响及其机制研究

目的:本课题通过对姜黄素-血红蛋白纳米颗粒(Curcumin@Hemoglobin,Cur@Hb)的设计合成,探究Cur@Hb纳米颗粒对乏氧肝癌细胞增殖、迁移、周期、凋亡、血管生成等细胞表型以及放

学位

Cur@Hb乏氧放射敏感性肝癌EMT

基于定量磁共振波谱技术对重度抑郁症患者海马代谢的研究

目的1.基于定量磁共振波谱(MRS)中AMARES(advanced method for accurate,robust and efficient spectral fitting)和QUEST(quantitation based on quantum estimation)两种不

学位

重度抑郁症定量磁共振波谱海马代谢物绝对浓度治疗反应预测

磁固相萃取用于芝麻油中黄曲霉毒素和多环芳烃检测的研究

食品安全问题一直是大众关注的焦点,近年来,食品安全事件频见报道,给国民经济和大众体质健康带来很大的威胁,食用油作为人们日常膳食的重要一部分,也经常遭受有机污染物的感染,严重危害人们的身体健康。油脂检测方法作为保障油脂安全的最后技术屏障,对其研究具有非常重要的现实意义。在对痕量有机污染物(如黄曲霉毒素、多环芳烃等)的检测中,前处理是整个检测过程中的重要环节,直接影响检测结果的准确性和可靠性。鉴于油脂

学位

磁性复合材料磁固相萃取芝麻油黄曲霉毒素多环芳烃

首发伴自杀意念青少年抑郁症患者基于低频振幅的静息态fMRI研究

背景抑郁症是以心境低落、认知受损和社会功能障碍为特征的致残性疾病,也是与自杀有关的最常见的精神疾病。青春期是自杀的高风险时期,据调查,美国高中生中有17.7%的人报告在

学位

抑郁症自杀意念青少年低频振幅静息态功能磁共振

miR-182在阿尔茨海默病中的诊断价值及作用机制

第一部分AD患者血清miR-182表达水平测定及临床意义研究目的探讨血清标记物miR-182在首诊阿尔茨海默病(AD)患者治疗前后血清中的表达变化及其临床意义。研究方法收集40例首诊

学位

阿尔茨海默病miR-182血清标志物诊断细胞增殖BDNF

基于深度学习的视频图像检索的哈希方法研究

与本文相关的学术论文