多标记跨模态语义哈希图文检索研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:cyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和社交网络的发展,网络上存在大量多源异构大数据。使用一个模态数据去检索其它模态数据的需求日益增加,跨模态检索就适用于这种场景。当数据量非常大时,如何实现快速、准确的跨模态检索是亟待解决的问题。近些年来,深度跨模态哈希检索借助哈希码存储开销小、相似性计算快的优势,以及深度神经网络强大的数据特征表达能力,引起研究者的广泛关注。然而,多数现有深度跨模态哈希检索方法简单地定义模态内和模态间样本对的语义相似性为离散的0(没有公共类别)或者1(有公共类别),而忽略了很多跨模态检索数据集和实际应用数据具有多标记信息,由于多标记数据集中的样本对有公共类别并且还有各自不同的类别,造成不能准确定义跨模态检索中成对样本的语义相似性,会对后续的哈希映射函数学习和哈希码学习产生影响,进而降低算法的跨模态检索精度。针对这一问题,本文以图像-文本二模态为例,在深度跨模态哈希检索中引入多标记学习,准确定义样本之间语义相似性,并进一步引入有效的多标记语义相似性约束策略,提高深度跨模态哈希检索精度。论文主要工作如下:1.现有的多数深度跨模态哈希方法没有基于多标记准确计算成对样本语义相似性,限制了深度跨模态哈希模型的学习能力。为解决此问题,本文提出一种基于多标记语义保护的深度跨模态哈希算法(Multi-label semantics preserving based deep cross-modal hashing,MLSPH)。MLSPH算法首先使用训练样本的多标记计算初始样本的语义相似性。随后,MLSPH算法基于定义的多标记语义相似性度量方法,定义一个多标记语义相似性保护策略。此外,MLSPH算法引入一个memory bank机制用于保持多标记语义相似性约束。在几个基准数据集上的实验表明,所提出的MLSPH算法超过了代表性的对比算法,并取得了较高的跨模态检索精度。2.上述MLSPH算法定义了成对样本多标记语义相似性,却又出现成对样本多标记语义相似性与相应哈希码相似性难于优化问题。为了解决这个问题,本文提出一种基于分层语义保护的多标记深度跨模态哈希算法(Hierarchical semantic preserving for multi-label deep cross-modal hashing,HCMH)。具体来说,首先,HCMH算法引入一种基于多标记的语义相似度计算准则,该准则利用多标记计算跨模态样本对的语义相似度。之后,对于不同范围的多标记语义相似度,该算法在实值哈希表示生成过程中利用Jensen-Shannon散度或负对数似然损失保持样本之间的语义相似度不变。在三个跨模态检索数据集的实验表明HCMH算法可以获得较好的跨模态检索精度。3.上述MLSPH算法和HCMH算法基于多标记信息准确计算样本之间的语义相关性,然而它们直接使用所有模态来学习哈希映射函数,忽略了每个模态中的原始数据都可能包含噪声的事实。为解决这个问题,本文提出一种基于多标记增强的自监督深度跨模态哈希算法(Multi-label enhancement based self-supervised deep cross-modal hashing,MESDCH)。MESDCH算法首先提出一个多标记语义相关性保护模块,该模块使用Re LU变换将算法学到的哈希表示之间的相似性的取值范围映射到多标记语义相关性的取值范围,同时,该模块定义一个正值约束的Kullback-Leibler损失函数,用于保持哈希表示的相似性与多标记语义相似性一致。最后,MESDCH算法将该模块与自监督语义生成模块整合,用于进一步提高深度跨模态哈希的性能。在四个跨模态检索标准数据集上的实验表明,提出的MESDCH算法在跨模态检索上取得了较好的表现。4.MESDCH算法利用多标记来监督哈希映射函数的学习,然而由于多标记的特征空间较稀疏,导致学到的哈希映射函数效果一般。针对这个问题,本文进一步提出一种基于多标记模态增强注意力的自监督深度跨模态哈希算法(Multi-label modality enhanced attention based self-supervised deep cross-modal hashing,MMACH)。具体来说,MMACH算法定义一个多标记模态增强的注意力模块,该模块借助注意力机制,使用多模态数据补偿稀疏的多标记特征信息。与此同时,MMACH算法定义一个多标记跨模态三元组损失函数,用于确保拥有较多公共类别的跨模态样本对具有较相似的哈希表示,拥有较少公共类别的跨模态样本对具有相对不相似的哈希表示。最后将定义的多标记模态增强注意力模块和多标记跨模态三元组损失函数用于深度跨模态哈希,借助自监督的方式实现基于多标记模态增强注意力的自监督深度跨模态哈希算法。在四个跨模态检索数据集上的实验证明了我们提出的MMACH算法的效果和效率。
其他文献
习近平总书记指出,“新时代中国青年要听党话、跟党走,胸怀忧国忧民之心、爱国爱民之情,不断奉献祖国、奉献人民,以一生的真情投入、一辈子的顽强奋斗来体现爱国主义情怀,让爱国主义的伟大旗帜始终在心中高高飘扬!”爱国主义作为中华民族的民族心、民族魂,是中华各民族在五千年发展历史中共同熔铸的最鲜明的民族品格和最宝贵的精神财富,是支撑和鼓舞中华民族和中国人民上下求索、自立自强、团结奋进的强大精神动力和精神支柱
学位
癌症是威胁全人类健康与生命的不可忽视的敌人。胃癌是起源于胃黏膜上皮的常见恶性肿瘤,在消化系统肿瘤中发病率排名第一。世界上每年新增的胃癌病例有超过半数来自中国所在的东亚地区。目前在胃癌治疗中主要采用外科手术、放射性疗法和化学疗法。而在进行胃癌治疗时,通常伴随患者的是化疗药物高毒副作用所带来的痛苦。因此,寻找开发新的低毒或无毒副作用的新型药物和治疗方法迫在眉睫。目前已知昆虫超过100余万种,是地球上数
学位
调频连续波(Frequency-modulated continuous-waves,FMCW)雷达是通过对连续波进行频率调制,根据发射信号和回波信号的频率差、相位差来获取目标信息的一种雷达体制。FMCW雷达因具备系统结构简单、体积较小、重量较轻、成本较低、无距离盲区、以及不易被截获等众多优势,逐渐成为雷达领域的研究热点。FMCW雷达的测量距离决定于发射FMCW信号的扫频周期,而其距离分辨率则取决
学位
由于经济全球化及西方饮食的影响,我国居民的膳食结构从传统的高碳水高膳食纤维逐渐向高脂高糖转化,动脉粥样硬化等心血管疾病的流行率逐年增加。因此,调节高脂饮食带来的脂质代谢异常是控制这类疾病发生和发展的重要手段。辣椒作为一种辛辣刺激食物被广泛食用,对人们的饮食结构有着重要的影响。近年来,许多研究证实了辣椒中的辣椒素可调节脂质代谢异常,推测的可能机理包括:辣椒素刺激其受体-香草素受体1(The vani
学位
酸橙(Citrus aurantium L.)是枳实、枳壳的基源植物,目前评价酸橙资源优劣的指标主要是其幼果中辛弗林(Synephrine)、新橙皮苷(Neohesperidin)和柚皮苷(Narigin)三种物质的含量。但是由于上述物质既非酸橙的特有,也非酸橙含量最高的次生代谢产物。此外,由于酸橙本身外观性状变异度高,民间同种异名现象严重,导致酸橙虽然具有独特的药用价值,但酸橙资源的利用受到极大
学位
植物能够产生近24 h的内源节律振荡,该生物钟系统能够协调内部生理与外部环境因子,使植物拥有更强的适应外部环境变化的优势。尤其是对受光温因素影响较大的水稻抽穗期来说,水稻内源生物钟的节律振荡对生长发育和高产稳产的保证至关重要。本研究通过Mutmap方法鉴定到一个水稻生物钟基因OsLUX,该基因突变导致oslux突变体在自然长短日照条件下均表现出极端晚抽穗的表型。本文主要围绕OsLUX的克隆鉴定、表
学位
加强对大学生突发事件网络舆情引导,有效化解网络舆情危机,提高网络治理效能,加强网络意识形态安全是构建和谐社会的基石。网络舆情是在网络社会条件下出现的舆情新态势,为适应社会发展变化对网络舆情引导也提出了新的要求。在新的历史条件下,伴随着大数据、人工智能、区块链等互联网技术的快速发展,大学生突发事件网络舆情出现了一些变化和新的特点,在一定程度上对大学生思想和行为的变化产生了影响。加强我国大学生突发事件
学位
一百多年来人们一直认为硝化过程由两种微生物分两步协同完成:即首先由氨氧化细菌(ammonia-oxidizing bacteria,AOB)和/或氨氧化古菌(ammonia-oxidizing archaea,AOA)将氨氧化成亚硝酸盐(NO2-),然后再由亚硝酸盐氧化细菌(nitrite-oxidizing bacteria,NOB)将亚硝酸盐氧化成硝酸盐(NO3-)。但在2015年底,两个科研
学位
植食性昆虫与寄主植物经历了长期的协同进化,并由此建立紧密而复杂的关系。在昆虫找寻食物的过程中,会面对呈混杂状态的植物来源化合物,其中有昆虫生长发育所必需的营养物质如糖类、氨基酸等,也包含植物用于化学防御的次生代谢物质,因此对昆虫而言在混杂的植物来源代谢物中进行物质识别和综合评判是至关重要的。昆虫具备灵敏的化学感受系统(包括嗅觉和味觉感受系统等)感知来自植物和周围环境的一系列信息,其中味觉感受系统主
学位
减贫一直是发展经济学重点研究的课题之一。虽然中国在2020年取得历史性消除收入贫困的伟业,但是,消除贫困不仅仅从收入视角着手,还应该解决教育、健康、环境、安全等多维度贫困问题。近些年,互联网、大数据等新兴技术的快速崛起和发展,深刻改变了农户的信息结构、生产行为、生活模式,并最终影响到减贫的逻辑和路径。因此,在互联网与农村经济深度融合的新背景下,互联网对于农户而言不再仅仅拘囿于一种外生技术,而是越来
学位