基于字典学习的跨模态监督离散哈希方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：hwangh

【摘要】

：

【作者】

：

吴烨

【出处】

：

山东大学

【发表日期】

：

2020年12期

【关键词】

：

近似最近邻检索哈希学习跨模态检索字典学习离散优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,因特网的发展和社交媒体的兴起使得多媒体数据规模增长迅速同时数据种类也不断增加。给定某个模态的查询,跨模态检索希望返回的是与其相似的另一个模态的样本,比如利用文本来检索相关的图片或视频。哈希方法凭借其检索速度快、存储开销小的优势在大规模数据检索领域引起了相当多的关注。很多基于哈希学习的跨模态检索方法被提出并取得了一定的检索效果,然而这些方法可能仍有一些限制。首先,大部分哈希检索方法直接采用线性映射来将不同模态的数据映射到公共的汉明空间中。哈希方法的目的是相似性保持,由于异构数据的复杂性,线性映射难以保持原始空间中的相似性,导致此类方法存在巨大的误差。其次,大多数监督跨模态哈希方法构建相似性矩阵的规则是:如果两个实例有至少一个相同的标签则视为相似。然而这种定义方式过于简单且丢失了很多有用的监督信息。最后,大多数哈希方法在优化的时候选择松弛或者舍弃离散限制来解决一个连续优化问题,再将实值解量化成二进制码,这会导致巨大的量化误差。目前已有一些论文提出采用离散优化策略,但这些方法通常仅适用于单模态。为了克服这些限制,本文提出了一个新颖的跨模态哈希方法,称作基于字典学习的监督离散哈希(Dictionary Learning based Supervised Discrete Hashing,简写为DLSDH)。DLSDH是两步哈希方法,分为哈希码学习过程和哈希函数学习过程。DLSDH构造的成对相似性矩阵和离散迭代优化策略使得哈希码学习过程学得更高质量的哈希码。在哈希函数学习阶段,DLSDH首先为每个实例生成稀疏表示,再映射到低维汉明空间中。本文提出的方法其主要贡献有:·提出了一种基于字典学习的监督跨模态哈希方法,首先为每一个模态学习一个字典并为每一个实例生成稀疏表示,相比于复杂的原始特征稀疏表示更适合映射到低维隐空间中,解决了相似的实例在低维隐空间中难以接近的问题。·为了充分利用原始标签信息,DLSDH使用余弦相似度来计算成对的相似性,新构建的相似性矩阵能更好地监督哈希码学习过程。·DLSDH采用列采样策略来解决离散优化问题,避免了量化带来的误差。同时,DLSDH在训练时使用的是整个数据集而不是采样数据,保证了哈希函数的泛化性能。·通过在三个数据集上与先进跨模态哈希方法进行对比实验,证明DLSDH的检索性能优于或者媲美先进对比方法。同时,实验证明了余弦相似性矩阵的有效性。

其他文献

李斯特《第二叙事曲》中悲剧性特征分析与教学演奏研究

《第二叙事曲》是李斯特两首叙事曲中极富悲剧性的一首,是李斯特借用钢琴的交响性笔法对古希腊爱情神话中文学形象的音乐再现,音乐的发展脉络与神话故事情节紧密结合,用充满悲剧性的音乐语汇汇集成高超演奏技法的叙事性音乐篇章。李斯特巧妙的创作构思结合以高超的演奏技巧,使得整部作品的音乐发展环环相扣,运用多种凸显作品悲剧性音乐特征的表现手法,丰富了音乐形象的塑造,推进了主体旋律的变形发展,形成了丰富多变的音乐织

学位

李斯特《第二叙事曲》悲剧性特征钢琴教学演奏技巧

CO2加氢制乙醇的化学热力学与动力学分析

化学热力学和动力学是物理化学课程的重要组成部分,该部分内容概念较为抽象,学生在学习过程中比较困难。我们以CO2加氢制乙醇的物理化学过程分析为例,阐述了化学热力学与动力

期刊

CO2加氢反应乙醇化学热力学化学动力学hydrogenation of carbon dioxideethanolchemical thermodyna

MeSH主题词选设与文献量相关度剖析

本文调查分析了《医学主题词表》的变化机制以及主题词选设与文献量之间的相互关系，旨在进一步把握ＭeＳＨ的变化特点，提高医学主题词医学文献检索与标引中的使用效果。结果表明：其一

期刊

主题词MESH《医学主题词表》变化机制局限性医学文献量选词原则Subject wordsMeSHSubject headings maintain

核心素养视角下小学数学深度教学方略探究

在小学数学的教学中,为提高学生的学习效率,一些教师倡导开展数学深度教学,让学生进一步理清数学的内在逻辑,不断提升其数学能力。文章以小学数学深度教学为主题,从核心素养

期刊

核心素养小学数学深度教学

pH值对聚合物前驱体法制备WO3薄膜光电性质的影响

以偏钨酸铵为钨源，聚乙二醇1000为配位聚合物合成了前驱体溶胶，并用浸渍提拉法在KTO导电玻璃上制备了WO3薄膜，研究了不同pH值对WO3薄膜结构和光电性质的影响。实验结果表明，降低p

期刊

PHWO3薄膜聚合物前驱体光电化学pH WO3 films polymetric precursor method photoelectroche

电子商务的功能和效益

电子商务具有多元化的主体和全方位的功能，它为商业带来了经营战略、组织管理及文化冲突等方面的变化；它能使企业降低运营成本、提高生产率和扩大市场空间；基于因特网的电子商务

期刊

电子商务效益网络经济功能企业运营成本生产率市场开拓Electronic BusinessEfficiencyNetwork economy

小篮球运动对4岁幼儿身体素质影响研究

随着当前生活水平的提高,儿童生长发育所需的营养变得越来越丰富,与此同时儿童摄入营养过剩带来的一系列问题也日益凸显,如何确保学前幼儿健康成长,已成为当前社会越来越重要

学位

幼儿身体素质小篮球

多氨基改性蔗渣对水溶液中pb^2＋、Zn^2＋、Cd^2＋、Cu^2＋吸附性能的研究

蔗渣经多氨基改性处理后，得到多氨基改性蔗渣吸附剂。考察了多氨基改性蔗渣吸附剂对模拟废水中Pb^2＋、Zn^2＋、Cd^2＋、Cu^2＋的吸附性能，主要包括吸附时间、溶液pH值和温度对吸附量的

期刊

多氨基改性蔗渣纤维素PB^2+ZN^2+CD^2+CU^2+吸附muhi-amino--modified bagasse cellulose

基于Web的图像搜索引擎

随着互联网的快速普及,宽带网的全力推行,网络上的图像信息急剧膨胀,多媒体文件越来越多,与此同时,用户对网上图像搜索的要求也在不断增长,在这种背景下,传统的文本搜索方式

期刊

图像搜索引擎WEB图像信息工作原理搜索方法Image search engine Web

多芯复合超导线拉拔的有限元模拟

利用商业有限元软件DEFORM-3D对多芯复合超导线材的拉拔过程进行有限元模拟,研究变形过程中复合超导线各亚组元的变形情况,以及拉拔速度对超导线成形的影响.分析超导线拉拔过

期刊

拉拔多芯复合超导线有限元模拟drawing multi-filamentary superconductor wire finite element

基于字典学习的跨模态监督离散哈希方法研究

与本文相关的学术论文