面向共同空间学习的多模态数据建模和检索研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：liying09

【摘要】

：

随着大数据时代的到来,以文本、图像、语音等为代表的多媒体数据在数据量和数据多样性上均达到了很大的规模,进而对这些多媒体数据进行检索和建模也逐渐变得具有吸引力,即针

【作者】

：

陈思佳

【出处】

：

西安电子科技大学

【发表日期】

：

2004年期

【关键词】

：

多模态数据融合多模态数据建模共同空间学习注意力渐进网络多信息融合采样注意力对齐的多模态LSTM

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据时代的到来,以文本、图像、语音等为代表的多媒体数据在数据量和数据多样性上均达到了很大的规模,进而对这些多媒体数据进行检索和建模也逐渐变得具有吸引力,即针对多媒体数据中存在的多模态性进行研究已经成为热点。而为了克服多模态数据存在的数据结构多样性、信息复杂性和对任务的不匹配性,多模态数据融合起着很重要的作用,其可以通过整合多模态中所包含的信息从而得到一个任务导向的统一表征。在这其中,面向构建统一表征的共同空间学习是主要途径,即针对数据中存在的多模态性进行建模,从而为多元输入学习潜在的共同空间从而实现稠密数据检索和目标定位、数据不平衡处理和多模态数据检索。本论文的研究以深度神经网络和深度学习作为共同空间学习的主要技术。首先,针对多模态数据中稠密数据的建模,本论文提出了细粒度渐进注意力定位网络(FPAN)以完成针对图像数据的检索和定位工作。即着重对深度学习如何建模图像数据进行研究,特别是解决输入目标图像在待检索图像上如何进行目标定位这一关键问题。对这一问题的解决有效地探索了稠密模态数据间的信息交互并有助于推动研究深度学习如何用于共同空间学习的建模。FPAN以全卷积网络、细粒度“软”注意力和级联上采样为基本模块,直接处理查询目标图像和待检索图像,以智能化的方式完成目标物体在待检索图像上的准确定位,从而实现多模态稠密数据到有效检索定位信息的转换。然后,本论文研究了在多模态数据建模中经常存在的数据不平衡问题,并提出基于多信息融合的混合采样算法(MIFS)以克服现有采样算法仅根据单一信息来指导采样而导致采样后的平衡数据可分性下降的问题。简而言之,现有采样算法不能准确定义有害和无用的样本,即仅根据单一信息不足以充分认知样本。本文提出的MIFS利用模型对数据的认知和数据的固有属性共同对样本进行定义,从而依据多种定义将数据集划分为意义明确的多个子集,然后在不同子集上采用与其定义相应的采样算法。通过这种算法平衡后的数据集,不但能有效保留原始数据集中的信息,同时充分填充有效样本,解决了数据不平衡中的关键问题。最后,本论文创新性地提出了可用于多模态数据检索的细粒度共同空间学习模型,以解决1)传统共同空间构建过程中的模态间细粒度信息丢失的问题;2)多模态间的对应局部信息捕捉模块难以和整体模块共同优化的问题。具体而言,本论文提出了一个新颖的包含注意力对齐机制的多模态长短记忆力网络(AAM-LSTM),其主要包含注意力对齐循环网络(AA-R)和分层多模态LSTM(HM-LSTM)。不同于传统的直接运行在粗略特征上的算法,本文提出的算法明确使用模态间和模态内局部信息的关联来构建多模态数据的统一表征。其中,AA-R在不需要标签的情况下能自动捕捉语义对齐的局部信息来学习共同子空间。HM-LSTM利用这些局部信息的潜在关联来完成细粒度共同空间学习。实验表明,由AAM-LSTM所得的细粒度共同空间能有效提高数据检索精度。

其他文献

Report of the UK Educational Policy

The equality of education is based on the interest of the governing party,and it has to fit the political faith of the governing party.No matter what kind of ed

期刊

equalityrightseducationdiscriminationgenderethnicsocial class

A房地产公司的L项目营销案例研究

A地产公司是起源于1993年的一家老牌地产公司,经历了许多国家政策改革与市场变化周期,通过20多年的不断努力发展与艰苦奋斗。逐步从一家只有1-2个项目的小公司做到了遍布全国20多个城市,上百个项目的百强房企。N市,作为A地产公司最早一批进入的重要支点城市,其意义十分重大。2013-2015年连续三年间,N市分公司都是A地产公司的重要投资核心与业绩支撑点。可以说,N市分公司的发展态势直接决定了A地产

学位

房地产营销市场量价突围案例研究

临床护理路径结合整体护理对晚期血吸虫病腹水型患者治疗效果及生存质量的影响

目的探讨临床护理路径结合整体护理对晚期血吸虫病腹水型患者治疗效果及其生存质量的影响。方法将我院收治的晚血腹水型患者90例随机分为2组,每组45例。对照组采用整体护理,

期刊

晚期血吸虫病腹水型临床护理路径整体护理治疗效果生存质量

原发性闭角型青光眼小梁切除术后浅前房的临床分析

目的:1.分析原发性闭角型青光眼患者的性别构成及年龄分布,为原发性闭角型青光眼的预防、诊治提供参考。2.报告原发性闭角型青光眼小梁切除术后浅前房的发生率,分析其原因、

学位

原发性闭角型青光眼小梁切除术并发症浅前房

不可逆矩阵的伴随矩阵的特征值与特征向量的求法

给出矩阵A不可逆时,其伴随矩阵A*的特征值和特征向量的简便求法,即当r(A*)=0时,A*的所有的特征值都为零,任一非零向量都是其特征向量;当r(A*)=1时,A*有n-1个特征值为0,另一个

期刊

不可逆矩阵伴随矩阵特征值特征向量

我国白羽肉鸡产业发展面临的主要障碍与出路

笔者介绍了我国白羽肉鸡产业的发展概况,从鸡群生产性能、肉鸡价格波动、禽病防治、环境污染、资金保障、肉品质量安全等方面分析了我国肉鸡产业所面临的主要问题,同时从提升

期刊

白羽肉鸡生产性能禽病防治环境污染价格波动资金保障发展障碍出路

我国水族传统体育文化研究综述

从水族传统体育文化的发展现状、影响因素与对策,水族传统体育文化的价值、特征、传承,水族传统体育文化的个案研究,水族传统体育文化的个别项目等4个方面对近20年有关水族传

期刊

水族传统体育文化

涤纶纤维专用抗菌母粒制备及其应用

介绍了一种专用于制备抗菌合成纤维的抗菌塑料母粒,采用含银共容组合物与高熔融指数的高分子树脂捏合,然后再与载体树脂共混,经双螺杆挤出机熔融挤出、切粒。采用本母粒与PET

期刊

抗菌涤纶母粒银

基于灰度变化的角点检测算法研究

图像特征提取是计算机视觉与模式识别领域中的研究热点和关键技术。作为图像的诸多特征之一,角点不仅具有光照、旋转等不变性,而且信息含量丰富、数据量小,因而广泛应用于图像匹配、相机标定、运动估计、三维重建和目标识别等任务中。在这些任务中,角点检测既是基础工作,又是关键步骤,且角点检测结果的好坏将直接影响到后续图像处理的性能,因此研究和完善角点检测相关理论和方法具有重要意义。本文首先对数字图像角点检测算法

学位

角点检测灰度变化Harris算法SUSAN算法实时自适应

亚氨基二乙酸改性硅胶颗粒对不同重金属离子的等温吸附

通过有机硅烷偶联剂γ-缩水甘油醚氧丙基三甲氧基硅烷(GLYMO)将环氧基团键合到硅胶颗粒表面,然后通过环氧开环反应将亚氨基二乙酸(IDA)接枝到硅胶粒子表层,增强其螯合吸附重

期刊

改性硅胶重金属离子最大吸附量

面向共同空间学习的多模态数据建模和检索研究

与本文相关的学术论文