基于深度学习的跨媒体检索方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:liongliong457
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术以及多媒体技术的迅速发展,海量的多媒体数据喷涌而出。然而,如何在这些类型多样,数量庞大的数据中获得真正有用的信息成为了一个难题。面对这种信息多元化趋势,跨媒体检索技术应运而生。与传统的单媒体检索相比,跨媒体检索可以满足人们在数据多源化时代下的检索需求。然而不同媒体之间存在着天然的异构鸿沟,这给跨媒体检索的实现带来了巨大的挑战。但多媒体数据具有底层特征差异,高层语义相关的特点,即不同多媒体数据形式存在差异,但其所表达的语义相同,这为跨媒体检索任务的实现提供了基本的理论依据。本文旨在利用深度学习的相关理论方法实现可靠高效的跨媒体检索方法,主体研究工作包括:(1)针对目前多数方法忽略媒体之间关联信息的问题,提出跨媒体残差注意力网络。该网络可以提取图像和文本的媒体内部特征,还能够挖掘多媒体数据之间的关联特征。同时,该网络利用注意力机制找出媒体数据中的关键部分,为关联学习提供精准的媒体数据内部特征。为了解决表征映射过程中的偏移问题,本文设计了一个基于分类损失和语义损失的跨媒体联合损失函数。该联合损失函数使用岛屿损失函数作为语义损失函数,交叉熵损失函数作为分类损失函数。通过联合损失函数,网络在确保不同类别可分离的基础上,约束类别内部的差异,以此提高表征分布的精度。(2)为了解决上述方法中网络特征提取能力不足的问题,提出了跨媒体两级网络。该网络使用多个不同的神经网络组成两级网络模型,利用底层网络对图像和文字进行特征提取,顶层网络挖掘媒体特征之间的关联关系。通过这一特殊网络结构,以此提高模型的特征提取能力。为了进一步增强网络的关联学习能力,提出了结合注意力的跨媒体关联损失函数。该损失函数借鉴了注意力机制的思想,利用学习到的特征注意力权重指导网络的投影映射过程,以此提高数据表征的分布精度。
其他文献
当前的点云分割方法主要分为基于多视角的方法、基于体素的方法和基于点特征的方法,以Point Net为代表的基于点特征的点云分割方法准确度通常高于多视角和体素方法。因此,本文考虑点云的点特征信息,为点云结构建模。现有的基于点特征的方法大多是通过多个多层感知机将点云映射为高维特征,并使用池化操作捕获特征,其捕获的点云特征学习过程是孤立的,通常未考虑点云间的邻域关系,损失大量的空间几何信息。不仅如此,由
降水现象观测是气象观测的重要内容之一,实现降水的自动观测,可以提供更好的气象服务,而提高降水自动观测的准确性,是其研究的重要内容之一。本研究基于航天科工23所航天新气象科技有限公司的农业气象自动化观测站项目,利用贵州省近百个台站在2017年至2018年的降水数据进行分析,发现目前的降水现象仪还存在某些方面的误差,主要体现在:出现雨夹雪时容易误报为雨和雪,对毛毛雨和冰雹的识别准确率较低,以及面对某些
行人检测与跟踪是计算机视觉研究的重要领域之一,通过对行人进行定位获取其运动轨迹,实现对行人目标持续跟踪。随着深度学习与人工智能的发展,行人检测与跟踪技术广泛地应用于自动驾驶、无人机、智能监控等领域。近些年我国服务机器人行业发展迅速,智能公共服务机器人愈发普及,对于服务机器人智能感知技术也提出了更高要求。本文以行人检测与跟踪为研究对象,研究行人检测、跟踪等感知算法,并将算法移植至服务机器人上,为服务
光纤传感器具有传统传感器所不具有的优势,现已成为传感学界的研究热点。光纤折射率传感器发展到现在主要有光纤等离子体共振型、光强调制型和干涉型。光纤马赫-曾德尔折射率传感器到目前为止主要有四种不同的结构类型,分别是错位熔接型、熔融拉锥型、光纤气泡型和纤芯失配型。通过制作锥型光纤的方法可以提高传感器的灵敏度,常见的制备方法有化学研磨法、研磨法和熔融拉锥法。本文设计了一种基于纺锤型空气腔的光纤马赫-曾德尔
在过去的几十年里,生物传感器因其广泛的工业和科学应用而引起了人们的密切关注。光学传感器是一种通过研究结构的光学特性来解决这些应用的有效分析工具。随着技术的进步以及资源需求的增多,高科技设备逐渐趋于小型化发展。光与金属纳米结构的相互作用显示出独特的性质,产生了一个称为表面等离激元的新兴领域。将金属纳米结构与光纤进行融合,可形成一种具有高灵敏度、抗电磁干扰等优点的光纤生物传感器。这类光纤传感器可通过监
随着人们对气候不断变化的重视,大气环境探测对传感器设备的观测精度要求也越来越高。地表气温上升的速度约为0.1°C/10年,然而由于太阳辐射的影响,地表气象站观测到的气温会高于真实大气温度,导致存在1°C量级的辐射误差。因此,为降低大气环境探测的辐射误差,有必要设计一种低辐射误差的温度传感器来提高测量精度。针对上述辐射误差问题,本文提出一种旋转式强制通风温度传感器结构。利用计算流体动力学(Compu
“边缘人工智能”(edged artificial intelligence,edged AI)将机器学习带到了移动端,为大数据的研究有效地降低了时间成本、经济成本、能源消耗,在人们的视线中逐渐明朗,众多行业中对边缘AI的技术研究也伴随着人工智能的发展与成熟逐渐崭露头角。随着气象现代化建设的进程,很多地方都建成了自动雪深探测仪,绝大多数地区都采用江苏省航天新气象科技有限公司自主研发生产的地面降水降
光纤传感技术作为信息化社会的一大热点,由此产生的光纤表面等离子共振(Surface Plasmon Resonance,SPR)传感器因其质量轻、抗干扰能力强、成本低、灵敏度高等特点逐渐在各个领域被广泛利用。本文设计了两种基于复合膜的双通道光纤SPR折射率传感器结构并能最终实现双通道测量。论文主要工作如下:1.利用光纤表面等离子共振理论,分别设计了侧边抛磨、级联式多模-单模-多模(MSM)两种双通
图像超分辨率重建能够提高图像的分辨率,恢复图像的高频信息。高分辨率图像拥有更多的信息量,对边缘细节信息描述的更具体。如今,随着计算机设备性能和人工智能技术的提高,把深度学习的卷积神经网络应用于超分辨率重建算法中成为研究热点。基于深度学习的超分辨率重建算法是通过软件的方式来改善图像的质量,具有成本低,灵活性强的特点。本文基于卷积神经网络的“深度”对超分辨率网络进行改进,主要体现在以下几个方面:(1)
随着3D(Three Dimension)成像技术的发展,深度图像发挥着越来越重要的作用。同时微软Kinect和飞行时间(TOF)相机等低成本3D扫描设备的诞生,为计算机视觉、图形、人机交互和虚拟现实等不同研究领域的新应用打开了大门。然而,由深度摄像机捕获的深度图像会产生各种类型的失真,这使得从深度图像中准确估计深度信息变得困难,影响人们的体验。为了解决深度图像的质量下降问题,可以采用合适的深度图