基于深度哈希学习的图文跨模态检索研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:liongliong476
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,图像、文本、音频、视频等多模态数据呈爆炸性增长,人们早已不满足于单模态数据之间的检索,例如图像检索图像,文本检索文本。随着多模态数据的日益增长,人们希望能实现多模态之间的互相检索,例如图像检索文本,文本检索图像等。因此,近些年来,跨模态检索成为了研究的热点。不同模态的数据拥有不同维度的特征空间,如何衡量它们之间的相似性成为了研究的难点。在现实生活中,无标签数据比有标签数据更容易获得,手动标注这些无标签数据,需要耗费大量的精力,如何在部分有标签数据的基础上,挖掘无标签数据包含的标签信息成为了研究的难点。为了更好地利用这些无标签数据,本文主要研究的是半监督跨模态检索方法。针对以上存在的问题,为了更好地保留多模态数据间的相似性,同时将不相似的数据分离开来,本文提出了基于模态相似性保持的半监督深度哈希模型。在此研究的基础上,为了更好地保留数据的特征信息,同时减少冗余噪声带来的负面干扰,本文提出了基于模态相似性保持的降噪自动编码器半监督深度哈希模型,进一步提高了跨模态检索的准确率。具体研究工作如下:1.针对现有的一些模型存在不能很好地保留多模态数据间的相似性,不能有效地将不相似的数据分离开来的问题,本文提出了基于模态相似性保持的半监督深度哈希模型(SS-LPDP)及学习算法。该模型分为标签预测、哈希码学习和距离保留三部分。首先利用深度神经网络提取图像和文本的特征,学习相应的哈希函数将不同维度的特征投影到一个公共空间中,根据部分有标签数据的特征分布来预测无标签数据的标签信息。然后将标签信息和提取的特征作为输入,进行哈希码学习和距离保留。最后根据每一轮训练中模型参数的变化,动态更新无标签数据的标签信息。实验结果表明SS-LPDP模型相较于最近的一些模型,在检索准确率上取得了一定的提高。2.针对SS-LPDP模型在训练时忽略了冗余噪声带来的负面干扰,在此模型的基础上,结合降噪自动编码器的思想,提出了基于模态相似性保持的降噪自动编码器半监督深度哈希模型(SS-DAE)。首先利用深度神经网络提取图像和文本的特征,将提取的特征输入到一个降噪自动编码器中,降噪自动编码器包含随机加噪部分、编码部分、解码部分三部分。然后根据部分有标签数据的特征分布来预测无标签数据的标签信息,将标签信息和编码部分提取的特征作为输入,进行哈希码学习和距离保留,同时,根据解码部分提取的特征和由深度神经网络提取的特征,定义降噪自动编码器的重构损失函数。最后根据每一轮训练中模型参数的变化,动态更新无标签数据的标签信息。实验结果表明SS-DAE模型相较于最近的一些模型,在检索准确率上取得了一定的提高。
其他文献
随着工业化的发展进程加快,环境污染问题日益突出。工业生产产生的有毒有害气体对人们的身体健康造成很大的危害。半导体金属氧化物气体传感器可以利用半导体材料与被检测的
近年来,随着大数据、云计算等信息技术的快速发展,云存储成为云计算技术上发展起来的一种新兴存储技术。云存储本质上是一个云计算系统,它具有存储空间巨大、以数据存储和管
磁流体力学(Magnetohydrodynamics,简称MHD)是研究等离子体(理想的导电流体)和磁场相互作用的物理学分支。MHD方程组是遵循质量守恒、能量守恒和动量守恒,且通过考虑流体速度、磁
在智能电网的建设中,以数字化、智能化为特征的智能变电站得到蓬勃发展和迅速普及,全站信息数字化、通信平台网络化、信息共享标准化的要求,需要大量与之相适应的保护控制产
在气象观测中,地面风速和风向一直都是最基本的观测要素。针对目前传统的测风设备部件极易损坏、多普勒测风雷达造价过高难以推广的问题,本篇文章提出了一种基于CCD的侧向散
目的通过检测在老年动脉粥样硬化性心脑血管疾病(atherosclerotic cardiovascular disease,ASCVD)的发作期及稳定期,患者体内的细胞免疫、体液免疫等水平的改变,观察免疫系统
【目的】本研究拟通过儿童特发性扩张型心肌病(Dilated Cardiomyopathy,DCM)的临床转归、特发性DCM患儿携带已知DCM致病基因概况及其与预后的关系、促炎细胞因子与特发性DCM
可重复使用运载器(RLV)应用广泛,在民用领域和军用领域都受到了国内外学者的高度重视,RLV飞行范围广,气动环境变化剧烈,对飞行控制的自适应性和鲁棒性提出了较高的要求。能够自主的调节控制性能是目前飞行器控制领域的发展趋势。本文主要针对飞行器的再入无动力返回段的控制系统进行研究,主要研究了以下几个方面。首先推导了飞行器的六自由度数学模型,在一定的前提假设下,构建了飞行器姿态控制模型和控制分配模型,为
在充分调研现有切割设备实际应用的基础上,针对传统的石材切割设备存在的设备庞大、切割精度低、对石材原材料强度要求高、出材率低、自动化程度低和石材锯切机械的工作环境条件恶劣等不足,为了给操作人员和加工场地周围构造安全、健康、高效和舒适的环境,提出了仿生自平衡自适应切削理论,将切割反力利用起来,变“被动”为“主动”,设计一种仿生自平衡自适应石材锯切装置,切割力在切割单元内部实现自平衡。本文主要开展的研究
近些年来,随着有机电子学的不断发展,有机发光二极管(Organic Light-emitting Diode,OLED)成为了微电子学领域研究的热点。但是,传统的单层OLED存在两个问题。第一,器件制备