面向大规模图像哈希学习的理论与方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:michaelbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今移动设备及互联网的普及带来了多媒体数据的急剧增长,给数据存储和信息检索带来了巨大挑战。由于哈希学习技术对于大规模图像检索任务具有存储成本低、检索效率高的优点,并且为图像提供了一种具有一定概念级语义特征,因此研究哈希学习技术具有重要的理论和实践意义。近几年哈希技术引起了越来越多的关注,并成为大规模图像检索任务的基础和关键步骤。然而,从底层视觉特征学习到的哈希码与高层语义之间存在巨大的“语义鸿沟”,设计高效图像哈希学习方法提高图像语义检索的性能是一个具有挑战性的问题。本文从图像哈希学习出发,以学习高质量的二值码为总体目标,重点研究了无监督哈希学习方法、对称的监督哈希学习方法、跨模态的监督哈希学习方法及非对称的监督哈希学习方法。本文的具体研究内容和主要贡献概括如下:(1)针对现有无监督哈希方法忽略了数据集的全局拓扑结构的问题,提出了基于流形排序嵌入的序保留无监督哈希学习方法。该方法从数据的流形结构出发,将流形排序嵌入、超立方体量化、信息论正则化约束以及流形排序与汉明排序一致性约束统一到一个联合的优化框架,并提出了一种交替的优化算法解决该离散优化问题。(2)针对现有无监督哈希方法假定数据分布满足流形假设(语义相似的样本倾向于位于低维的流形上)在大的类内变化可能会弱化的局限性,提出了基于非负矩阵分解的无监督哈希学习方法。该方法将非负矩阵分解学习到的高水平特征表示,同比特平衡、比特独立约束以及样本外的扩展项联合起来学习有效的离散哈希码,并研制了一种交替的优化算法解决该离散优化问题。(3)针对现有深度监督哈希方法采用单流框架(单个分支)解决单个检索任务或者采用双流框架(两个分支)同时解决检索任务以及分类任务,而无法充分利用监督信息引导哈希码的学习问题,提出了一种基于多任务学习的深度哈希学习模型,该模型能够利用网络输出的哈希码同时完成图像分类及图像检索任务。最后利用这个两个任务的联合学习,生成紧致及判别性的二值码,有效地提升了图像检索的性能。(4)针对现有深度的跨模态监督哈希方法不能很好地保留哈希码的判别性和全局的多水平相似性,提出了一种基于全局语义及局部语义保留的深度跨模态监督哈希学习方法。该方法将捕获模态间相关性的局部语义结构保留项、捕获模态内相关性的全局语义结构保留项以及针对同一实例不同模态数据生成统一哈希码的一致性正则项整合成一种端对端的学习框架,生成能保留局部与全局语义结构的哈希码,有效地提升跨模检索的性能。(5)针对对称的哈希方法训练过程非常耗时而且无法充分利用大尺度数据中的监督信息的问题,提出了一种基于度量学习的非对称深度离散哈希方法。该方法将非对称哈希学习策略与深度度量学习方法整合一起,利用单个网络通过端对端的学习框架,提升数据库图像的离散编码过程与查询图像特征学习过程的兼容性。实验结果表明,提出算法在大多数数据库上的哈希检索性能优于现有的哈希方法。
其他文献
对适航规章关注的喘振和吸雨、吸雹等特殊运行环境安全问题中,航空发动机非线性气动热力模型建立方法开展需求分析及其进展综述。在分析发动机动态特性和过渡态仿真方法基础
烃类的异构化过程是生产高辛烷值清洁汽油调和组分的重要途径,通常采用金属-酸双功能催化剂。异构化催化剂载体的孔道结构和酸性质是影响异构化性能的关键因素。本文针对石油
本文采用了激光主动照明与偏振成像技术相结合的方法以实现复杂气象条件或恶劣环境下的目标图像获取,并研究先进图像融合算法提升图像质量。基于此技术围绕激光束的传输变换
地方公共品是促进区域经济增长和提升辖区居民福利的重要保障,也是地方政府发挥职能的重要抓手。然而,与基础设施等经济性公共品供给快速发展相比,我国教育、医疗等非经济性
随着陆地资源日渐减少,人们逐渐把更多的目光投向了蕴含大量且丰富生物能源和矿物资源的海洋。随着人类对海洋资源的不断开发和利用意识的提高,作为实现海洋作业和科学考察重
随着电力行业的市场化发展,电能用户对供电可靠性尤其是连续性的要求越来越高。但是由于人为、气候等多种因素的影响,电力系统故障的产生是不可避免的,由此造成用户供电中断
本文以单缸斯特林发动机模型制作为例,说明了斯特林发动机在高职机械专业项目教学中的应用,此项目不仅使学生了解了斯特林发动机的工作原理,而且通过其组成零件的机械加工,综合训
地源热泵作为一种可再生能源利用技术,近年来逐渐成为建筑行业节能方向的研究热点。其中,竖直单U型地埋管地源热泵由于占地面积小、性能稳定等优点而得到广泛应用。地埋管是地源热泵系统与土壤进行热量交换的关键装置,其传热模型的合理性对系统的设计至关重要。然而,现有的传热模型都有一些不足,如大多数解析模型忽略了管内流体热容、U型管热容、U型管两支管间的热干扰或流体温度非线性分布等因素的影响,而二维、三维数值模
目的探讨白介素-18(IL-18)、热休克蛋白70(HSP70)对心肌梗死后诊断的法医学意义。方法筛选出60例心脏标本,分为心肌梗死组和正常心肌对照组,采用MaxVision免疫组化方法、图像分析
从2014年开始,中国民间投资的下滑成为公众以及学界关注的热点问题。从宏观经济数据上来看,中国民间固定资产投资的变化特征表现为:民间固定资产投资累计增长率、相对于整体