多模态学习模型研究及其应用

被引量 : 0次 | 上传用户:zhuchonge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今最为活跃的多媒体技术催生出文本、图像、声音和视频等不同类型的多媒体数据。这些不同媒体数据通常呈现出多模特性,而多模态学习就是处理这类多模态数据的一类重要学习模式。它处理的数据不限于多媒体数据,还包括其他呈现多模特性的数据。多模态学习通过如何有效关联多模态数据、学习共享子空间,挖掘出多模态数据的潜在共享信息,是多模态学习模型的关注点之一。本文将一些典型视觉应用视为多模态学习模式,并研究有效的多模态学习算法来提升这些视觉任务的效能。这点不同于现有多模态学习模型,它们通常只关注方法论本身。具体为,本文期望在视频跟踪应用中,利用典型相关分析来挖掘不同图像块之间的关联性,来提升跟踪效果;在图像检索应用中学习图像和其标签的共享子空间;基于标签游走和非负矩阵分解方法,实现半监督学习过程;将跨模态检索模型推广到语义匹配。本文主要工作包括四个方面:1.提出了基于l0约束的在线典型相关分析模型。图像中同一目标的不同部分,可视为目标的不同模态表征。这是因为同一物体包含相同像素值,但同时又存在不同的差异,暗含高度关联性。在视频跟踪任务中,为揭示这种关联性,提出了高效的在线典型相关分析方法改善外观模块和运动模块,提升跟踪器的性能。这带来两个优势:1)外观模块采用增量子空间方法,在跟踪过程中,避免求逆运算,有效地减少了计算复杂度;2)运动模块采用基于l0的鲁棒性表达,求出最大概率粒子,从而获得下一帧中最佳候选目标。通过定量和定性实验分析,提出的跟踪器有效提升原有单模跟踪器的效能。2.提出了自协作的哈希模型。将单模图像检索中的图像及其标签分别视为两类不同模态特征,提出了自协作有监督哈希模型。通过学习图像和其标签两个数据集的共享子空间,同时保持每个模态的独特性,并结合图嵌入保持样本间的近邻关系。此外,在不用增加额外约束项情况下,解决无监督模型中的标签缺失问题,以及通过图嵌入学习标签信息有效保证了自协作哈希模型能够处理多模数据。大量图像检索实验表明,提出的模型优于现有的浅层模型。3.提出了基于标签游走的非负跨模态哈希模型。在仅有少量标注的样本情况下,利用流形平滑思想,将标注数据的标签游走到无标签样本上。为缓解游走过程中因多模态间的语义差异所导致的标签传播误差,结合非负矩阵分解进行特征重构,将高维图像和文本数据映射到哈希子空间,来提高跨模态检索的检索效率和精度。通过实验验证了模型的有效性。4.设计了鲁棒的有监督跨模态检索模型。在标签监督下,将文本和图像两类媒体数据通过自身子空间映射到同一公共子空间,实现图像-文本语义匹配。同时,使用l2,1-范数实现特征选择,提高模型的鲁棒性。在三个实际图像-文本数据集上的跨模态检索实验,验证了提出算法的有效性。
其他文献
期刊
互联网金融蓬勃发展,但互联网和金融相结合产生了多种新的金融风险类型。为此,社会各界应有效认知互联网金融的价值,采取合理方式维护金融经济的发展。本文分析新时期下互联网金融经济的风险类型和成因,并提出相应的防范措施,以期促进互联网金融的健康、快速发展。
图像修复是计算机图形学领域的一个热门课题。传统的图像修复方法基于图像本身的冗余性,根据图像中缺损周边的像素和区域信息进行推理并逐步向内修复,修复结果存在边界模糊及填充纹理不自然的问题。人脸图像有别于一般自然场景,人脸结构固定,脸部器官对称且具有唯一性。由于人脸图像被遮挡部位的信息并不冗余,传统方法的修复效果不佳。近年来,研究者广泛采用生成对抗网络完成图像修复任务。当前人脸图像修复方法仍有缺陷,比如
《普通高中英语课程标准》(2017版2020年修订)指出高中英语课程具有工具性和人文性融合统一的特点。工具性是指学生可以利用这一语言顺利进行交流,而人文性是指通过语言的学习,学生能够领会语言的内涵,塑造健康人格,提升自己的修养,实现身心和谐发展。长期以来,高中的英语教学只重视学生语言知识的学习,强调语言技能的培训,而忽视了对学生内在素养的培养。简言之,就是只强调语言的工具性而忽视其人文性,只注重教
文章基于2011—2019年中国9个主要城市群的数据,采取Dagum分解方法、核密度非参数分析方法及空间计量分析方法,研究了城市群数字经济发展的空间差异、分布动态及空间收敛情况。结果表明:(1)从空间差异来说,城市群数字经济总体基尼系数呈下降趋势,城市群组间差距是城市群总体数字经济差距的主要来源。从贡献来说,组间差异的贡献基本处于不断下降趋势,而组内差异的贡献基本处于不断上升趋势。(2)从分布动态
<正>日本是一个岛国,土地资源严重不足,人口老龄化严重,多发火山、地震等自然灾害,但日本的农业发展一直走在世界前列,在农业发展先进国家中,位列第三位,那么,日本农业发展是怎么样养活日本1.2亿多人口,并且实现农产品出口的呢?
期刊
幼儿是我国社会发展的希望,因此国家现阶段对学前教育的重视程度越来越高,幼儿衔接能够给幼儿园儿童顺利进入小学生活奠定基础。结合幼小衔接概念与重要性,分析园所管理现存问题,提出树立正确管理观念、关注个体成长需求、培养环境适应能力、联动家校合作等策略,为开展相关工作提供参考。
随着教育改革日益深入,在学科教学中更加注重发展学生的核心素养。教师在高中地理作业的优化设计中,需要立足核心素养的发展导向,实现在作业练习中对学生核心素养的多元化培养。地理作业是联结课堂理论知识和课外实践的重要载体,教师可在多元化作业的设计过程中引导学生在知识巩固、实践练习、创新应用等方面提升学生对地理知识的认知理解和转化应用。
<正>6月1日,国家发展改革委、国家能源局等9部委联合印发《“十四五”可再生能源发展规划》(简称《规划》)提出,到“2025年太阳能热利用、地热能供暖、生物质供热、生物质燃料等非电利用规模达到6000万吨标准煤以上。”这是《规划》所定目标之一,其他三个目标(总量目标、发电目标、消纳目标)也都有生物质能的内容。毋庸置疑,生物质能源是可再生能源的重要组成部分。在此之前,5月10日,国家发展改革委印发的
期刊