面向模态不均衡数据的多模态学习技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:seuarchi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真实应用中的复杂对象语义丰富、表示复杂,如:包含文字、语音和图像的多媒体数据以及用于身份识别的面部和指纹特征等,这些从不同角度刻画或描述同一事物的数据被业界称为多模态数据或多组特征,如何将复杂对象表示为多组特征并加以学习成了研究者关注的重要任务,进而产生多模态学习。多数已有的多模态学习方法赋以多组多模态特征以相同的重要性,但在真实应用中不同的模态的重要程度是不同的,例如,在身份识别任务中使用指纹特征比面部特征更能获得更优的识别率。为此,本文对强模态辅助弱模态,并减少强模态收集开销进行了分析和研究,取得了如下创新成果:1.对不同模态的强弱加以划分,并提出了Auxiliary Information Regularized Machine (ARM)方法。该方法对弱模态最具有判别信息子空间加以提取,同时采用正则化技术对弱模态子空间信息加以有效利用,以此提高强模态预测。2.为减少强模态的收集开销,提出了ACQUEST(Active QUErying STrong modalities)框架。该框架通过主动查询挑选样本对应的强模态特征而不是标记信息,通过逆向预测技术缓解了对强模态特征取值查询可能带来的组合爆炸问题,将ACQUEST转为统一的优化模型,从而降低了整体的特征抽取开销。3.为了更有效使用强模态的领域知识辅助弱模态进行特征学习,提出了结合深度学习技术的多模态学习方法。该方法侧重在训练阶段利用强模态特征辅助弱模态学习更鲁棒的深度网络。
其他文献
文章描述了密码系统的一般原理,详细分析了私钥密码体制和公钥密码体制的运行机制并对它们加以比较,指出了它们的优点和固有缺陷,提出了两者的结合方案.文章还分析了两类系统
该文是以媒体网关为研究对象,从理论分析和实践开发两个方面对网关的体系结构、语音实时处理子系统中的主机通信及多任务调度、语音编码和回声消除等关键技术问题进行了深入
工作站群集是经网络连接的多台工作站,各工作站之间利用消息传递(Massage Passing)来协调工作。PVM(Parallel VirtualMachine)是现时使用较广的消息传递系统之一。 本文用两个P
该文给出了山东移动通信计费数据采集系统的网络设计与软件实现的方法.在系统网络设计方面,该文提出了一种实用的解决方案.通常.计费数据采集网络的设计有分布式和集中式两种
应扫描仪客户的要求,为实现在数字栅格地图(DRG)项目方面的自动化以提高工作效率,进行了彩色地形图分色的研究与开发。本文在分析和研究了色彩分割的相关理论后,针对彩色地图的独
该文首先介绍了目前的防火墙技术,分析了包过滤、应用网关、代理服务、电路层网关、状态检测、自适应代理技术和防火墙的配置,通过对TCP/IP协议系统的分析,在常见的Win9X和以
本课题的目的是研究过程工业监测系统的三层模型结构设计和内置脚本设计。 过程工业监测系统是涉及企业生产现场、生产调度和生产管理等企业各个部门的网络系统。为了使生
随着互联网技术的快速发展,电子邮件的使用越来越广泛,已经成为互联网上最常用的功能之一。但是,目前收发电子邮件的工具,仍是以计算机为主(包括掌上电脑等范畴),其价格昂贵,操作较复
该文通过对空中交通管制程序、陆空通话模式、机场管理方式等的分析综合,提出并拟定了基于图形工作站实现塔台管制模拟器的总体方案.在此基础上,讨论了三维真实感图形实现的
随着网络特别是Internet的迅猛发展,网络并行计算成了并行计算新的研究方向.我们改进了WebParallel网络并行计算模型.WebParallel模型采用了客户/服务器模式,以浏览器为计算