多模态学习相关论文
近年来深度学习在计算机视觉(CV)和自然语言处理(NLP)等单模态领域都取得了十分优异的性能.随着技术的发展,多模态学习的重要性和必要......
当今最为活跃的多媒体技术催生出文本、图像、声音和视频等不同类型的多媒体数据。这些不同媒体数据通常呈现出多模特性,而多模态......
为了解决多模态场景分类准确率不高的问题,文中提出一种由互编码器辅助视频的多模态场景分类方法。音频部分首先对输入音频数据进......
随着数据的爆炸式增长,数据的复杂程度不断提高,基于多源数据的信息挖掘技术已经被广泛应用于生物特征识别、计算机辅助疾病诊断等......
信息与通信技术的发展加速了社交媒体融入到大众的日常生活中,用户从传统的信息消费者逐渐转变为信息的生产者。用户在社交平台上......
随着世界全球化深入发展,科技与教学方式不断变革,研究新的有效的教学模式、提高学生英语写作能力迫在眉睫。相关研究表明,传统英......
针对当前多模态网络存在模态特征信息提取困难、模态间的信息差异,模态间信息融合不充分而导致网络模型预测精度低等问题,提出基于ST......
近年来,随着计算机视觉和自然语言处理技术的高速发展,视觉问答(Visual Question Answering,VQA)在仿生机器人、智能教育和视觉障碍......
Image caption即自动生成图像的描述语句,也可理解为“看图说话”,如今,image caption已在多个领域得到应用,比如幼儿教育、图像检......
医学图像分割是计算机辅助诊断重要的一环,能帮助医生定位目标,实现定量的术前评估。为了全面了解病人的状况,医生往往使用多种成......
近年来,机器翻译技术的快速发展为不同国家人民之间的交流带来了极大的便利。机器翻译指将一种模态的语言表示转化为另一种语言表......
随着信息科学技术的迅猛发展,人们对于室内定位的需求也越来越高。基于信道状态信息(CSI)的室内定位技术也逐渐成为研究热点,本文将C......
计算机技术迅猛发展,机器学习在生活中的应用场景越来越多。目前,很多机器学习算法依赖大量的标注样本训练才能完成分类任务,但一......
基于视觉信息的多模态机器翻译是指在文本机器翻译的基础上,以图像或视频的信息作为辅助帮助模型理解上下文从而提高机器翻译系统......
得益于互联网和移动设备的广泛应用,以信息流形式为基础的电子商务平台和短视频平台正在占用更多的流量和用户时长。为了解决“信......
针对石油化工企业在安全生产管理工作中面临的问题和挑战,石油化工企业通过提升数字化、智能化的应用实现数字化转型,提升企业的本......
随着“互联网+教育”的深入发展,网课已成为当代大学生的重要学习方式之一.文章立足于对网络授课教学流程的设计,重点探索如何将网......
模态指代事物发生的方式或是事物被体验的方式[1],多模态是两个或者两个以上模态各种形式的组合,当一个数据集或者研究中包含多个......
多视图分析能够较好地利用不同视图之间信息的兼容性和互补性,比单视图分析具有更好的决策性能,目前广泛应用于计算机视觉、目标检......
阿尔茨海默症(Alzheimer’s Disease,AD)是最常见的神经退化疾病之一,严重危害患者的生命健康。核磁共振成像(Magnetic Resonance Ima......
随着移动设备的全民普及,热点新闻获取的渠道从原先的电视广播和报纸转向了手机和平板,移动设备上的社交平台也成为了用户分享和传......
近来,机器翻译发展迅速。该领域中一些新出现的技术可以有效提高模型的翻译性能,例如屏蔽、回译和预训练等技术。但是这些新技术难......
为了让科学家快速定位实验关键过程,获取更为详细的实验过程信息,需要对空间科学实验自动添加描述性文字内容.针对空间科学实验目......
社交网络数据中所包含的情感对于获取网络用户的思想、观点至关重要,其研究成果已成功为产品推广、政策制定等领域提供有效的参考......
随着科技的发展,自动驾驶技术离人们的生活越来越近,而场景理解作为其研究中的重要一环,也受到广泛关注。基于二维图像的场景语义......
转发预测在社交媒体网站(Social media sites,SMS)中是一个很有挑战性的问题.本文研究了SMS中的图像转发预测问题,预测用户再次转......
学习高质量的视频表征有助于机器更准确地理解视频内容。基于监督学习的视频表征需要标注海量的视频数据,而视频标注极其费时费力,......
基于多模态学习模式问题分析,围绕多模态学习环境营造、课程资源研发、师生互动创设、作业设计及管理体系建构等,探究“实用英语”......
随着互联网2.0技术的快速发展,一系列围绕着多媒体内容的研究不停地涌现出来。身处于这样一个多媒体的时代,人们也在日常生活中不......
伴随着网络技术的迅猛发展,伴随着“互联网+”的概念的提出,网络上涌现出了大量的图像,人们也期待能够从这些海量的图像中快速找寻......
在信息技术快速发展的今天,每天都有大量的文字、图像、音频、视频等多模态数据发布和传输在信息网络上。这些数量庞大且纷杂的数......
由于现有的大多数跨模态哈希方法未能有效地探究不同模态数据之间的相关性以及多样性,导致检索性能不尽如人意。为了克服该问题,提......
近年来,多源数据的获取变得越来越容易,大规模的多源数据集为研究多模态学习提供了便利。同时深度学习的发展帮助多模态学习完成了......
随着深度学习研究的发展,各种人工智能技术正逐步应用于社会生活,人物识别是人工智能领域中的一项重要内容。在实际应用领域中,视......
随着科学技术和医疗水平的发展,医院每日都会产生大量的医学影像数据,这增加了放射科医生医疗诊断及影像报告撰写的负担。医学影像......
学位
日常生活遍布着各种各样的数据,如语言,文字、图形和声音等,类似这样的事物的存在方式就是模态。而多模态指的是两个及以上的模态......
多模态学习是数据挖掘、机器学习等相关领域的重要研究内容。相对于单模态学习,多模态学习旨在建立能处理和关联多种模态信息的模......
随着互联网的快速发展,大量的复杂数据对象可以从多种信息渠道被获取或由不同提取方式的多模态特征来描述。因此,多模态学习引起了......
随着数据收集能力的提高,我们可以获得越来越多的多模态数据。在实际应用场景中,往往存在着模态不平衡现象:不同模态对于任务的重......
人工智能发展到今天,机器对于多模态数据之间关系的处理和理解越来越重要。视觉图像和其自然语言描述的相关性关系的研究是其中一......
在社会化媒体时代的社交网络平台上,图文并茂的表达方式已经成为主流。相比于原创一段文字并发布于社交媒体,用户创作图片的过程明......
随着互联网技术的发展,各行各业每时每刻都在产生大量高维数据,人类已经进入大数据时代。同一对象的不同模态数据采集技术和多种模......
针对传统阿尔茨海默症辅助诊断算法使用单一模态数据,以及丢弃缺失模态样本的问题,本文提出了一种基于非对称多模态学习的阿尔茨海......
基于已有的视觉空间和文本空间上标签相关性建模方法,提出一种多模态子空间学习的语义标签生成方法。通过建立视觉特征相似图,以非......
全球化的进一步发展凸显了商务英语能力在国际经济活动中的重要性,而身处大数据时代,商务英语学习与计算机网络的结合成为趋势。面......