基于哈希算法的大规模图像最近邻检索算法研究

来源 :电子科技大学 | 被引量 : 10次 | 上传用户:watta515
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的广泛普及和多媒体技术的迅速发展,各行各业积累的数据急剧增加,每天互联网上大量的多媒体数据需要被处理。在大数据时代,由于数据的爆发式增加,现代信息技术基础设施不得不处理如此庞大的数据库。事实上,与存储成本相比,在大型数据库中检索相关内容是一项更具挑战性的任务。特别是在搜索多媒体数据,例如音频,图像和视频的检索,在准确率和计算成本方面,可用的解决方案和实际需求之间存在着很大的差距。大规模图像检索技术通常对于存储空间和检索时间有着特殊的要求,近年来,哈希算法作为一种代表性的最近邻检索技术,已经成为了处理大规模图像检索问题的主流算法。哈希算法旨在将图像数据转换成哈希码,从而达到减少存储空间和缩短检索时间的目的。大量的研究也证明了哈希算法的有效性。本文将集中研究哈希算法现在的挑战,并且提出相应的解决方法。在已有的非监督哈希算法的研究中,在汉明码空间中保持原始空间数据的近邻关系(或者相似性)是很多论文通用的目标。然而,目前已有的哈希算法仅考虑原始空间的整体结构如样本对(又称二元组)邻接关系,却忽略了原始数据空间中存在的局部几何结构,而这种局部几何关系对于相似性检索至关重要。本文从保存原始空间中的样本对近似关系和局部线性结构的角度,提出了一种新的哈希算法框架,在这个框架中,通过稀疏编码的方式找到原始数据空间的局部线性结构;然后构造目标函数,实现在哈希空间中保存二元组的相似性关系,重构局部线性结构,最小化哈希码的量化误差的目的。在这种新型的哈希算法模型中,本文提出学习使用非对称哈希函数模型,从而能够更好的保存样本对相似性和原始空间的局部线性邻接关系,最后生成紧凑有效的哈希码。在标准数据集上的实验也证明了本文提出的算法在所有的对比试验中达到了最好的性能。基于深度学习的哈希算法可以同时进行特征学习和哈希函数学习,从而提升了图像检索性能。本文提出了一种新型的深度非对称哈希算法,用于监督哈希算法的学习。主要的思想是利用两个不同的深度卷积网络作为非线性哈希函数,共同联合训练,使网络对应输出的哈希码能够很好的诠释语义信息中包含的相似度关系。本文定义新的目标函数来保持图像之间成对的相似性信息。三个数据集上的实验也证明了本文提出的模型在大规模图像检索方面具有最先进的性能。
其他文献
英飞凌科技股份公司推出一个完整的设计套件,可使基于32位TriCore微控制器的嵌入式设计符合IEC61508的功能性安全要求。英飞凌进一步开发出PRO-SIL安全产品,旨在以其基于TriCor
宽敞明亮的房间里,一群年轻人在计算机前键鼠并用,运指如飞。伴着他们熟练的操作,一帧帧线条清晰到位、参数准确的工件3D建模图很快出现在屏幕上。随后,这群年轻人以工件3D建
本症又称婴儿获得性凝血酶原复合因子缺乏症或乳儿原发性维生素K缺乏症。自70年代以来报道较多,其本质与新生儿出血症相似。但预后不良,病死率高达18%~50%存活者多数留有永久性
本文通过作者多年工程实践,理论指导和实际经验相结合,探讨提高施工现场管理水平的方法和措施,优化建筑施工企业的现场管理,合理组织施工,安排生产,最大化的提高企业的经济效率,保障
目的:探讨螺旋CT胆道三维成像方法的应用价值,提高胆道疾病诊断治疗效果。方法:对21例“T”管引流术后病人,经“T”管注入5%碘造影剂后,行上中腹薄层螺旋扫描,小间隔重建,工作
“百年大计,质量第一”施工单位的精心施工是保证工程质量的前提,监理单位的严格监理是工程质量的有力保障。本文阐述了监理工作对建筑施工阶段质量控制的意义和作用,提出了施工
各种Internet骨干网方案比较晏卫忠译近两年来,一个流行的话题是“合二为一”──将传统的基于局域网(LAN)的数据网与传统电信网合并为早已不堪重负的Internet网。目前,新、老电信公司都在不遗余力地
TDK株式会社集团下属子公司TDK—EPC推出电感特性的积层陶瓷线圈MLG0603S系列。该产品为了提高电感特性,对线圈电极形状进行了设计,并通过提高TDK擅长的材料技术、加工技术,实现