基于用户感知机理的跨模态传输策略研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:xuru69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无线通信技术的飞速发展,由传统视听服务和新兴触觉服务相互加持而成的多模态业务,正逐渐成为多媒体业务的主流。实现异构码流的高效传输是支撑多模态业务的核心技术之一。然而,现有研究通常将多模态信号单独处理、传输,无法满足异构码流多样化的传输需求。此外,数据量的激增和传输过程中不可避免的信号失真、延迟、丢失等问题也成为了影响用户沉浸式体验的重要因素。鉴于此,本论文探讨了多模态业务场景下异构码流传输的优化问题,从人类感知机理出发,提出一种跨模态传输策略,旨在全面提升终端服务质量和用户沉浸式体验。本文主要贡献如下:首先,本文提出了一种基于用户感知机理的跨模态传输框架。该框架从人类掩蔽效应和不同感官模态间关联性出发,分别在发送端和接收端进行高效的数据压缩和高质量的信号修复、重建,以全面提升传输质量。其中,针对融入触觉模态所引起的码流数据总量激增问题,本文深入探究人类对于音频和触觉信号的掩蔽效应,设计了一种触-听觉联合压缩方案。该方案充分利用了频域掩蔽和时域掩蔽的相关特性和性能优势,在不影响用户感知的基础上,显著降低触觉和音频数据冗余,缓解网络传输压力。其次,针对传输中因噪声、损耗等因素引起的视觉信号严重失真、部分缺损的问题,本文通过深入发掘不同感官模态间的潜在关联性,提出了一种基于注意力机制的跨模态视觉信号修复方法。该方法以编码器-解码器为基础网络,通过触感信号对部分缺损的视觉感官信号进行跨模态修复。首先,引入注意力机制精准定位缺损区域,准确建模表征视觉缺损区域的转移特征;其次,基于公共语义和监督信息不断缩小触觉特征与转移特征之间的距离,挖掘触觉信号中与视觉缺损区域最为相关的特征;最后,将像素间感知约束和对抗损失函数相结合,利用所挖掘的触觉特征对视觉信号进行跨模态修复。最后,针对传输中因高同步性要求、网络阻塞造成的视觉信号延迟、完全丢失的问题,本文充分挖掘非视觉感官模态间的一致性和互补性,设计了一种音频-触觉融合的跨模态视觉信号重建方法。该方法利用非视觉感官模态间语义相关性,通过听觉和触感信号重建视觉感官信号。首先,提取音频和触觉信号低层次特征,并将二者特征基于公共语义进行高层次融合;其次,将融合特征映射到视觉特征空间,并引入对抗机制不断缩小模态分布差距;最后,联合生成对抗损失和感知重构损失,利用具备视觉语义的融合特征进行跨模态信号重建。与此同时,引入知识蒸馏技术和层次约束结构实现高质量、细粒度重建。
其他文献
随着社会经济的不断发展,功率器件的结构复杂度日益提升,各种终端技术也被引入进行器件性能的优化与改进。但随之而来的是器件性能评估难度的增大。目前,性能评估主要依赖于以计算机辅助设计(Technology Computer Aided Design,TCAD)为核心的仿真工具,但是其存在仿真时间长、算力消耗大、仿真收敛性差等问题。同时,功率器件技术的高速迭代对器件设计效率也有了更高的要求。因而如何实现
学位
随着无线通信技术的快速发展,大量的机密信息在无线信道中传输,这对通信系统的安全性要求不断提高。无线通信技术因为其通信信道的开放性和广播特性,使其面临着许多安全问题。在5G以前,传统的安全认证大多是构筑在物理层之上的加密技术,随着网络发展、接入设备的爆发式增长和计算能力需求的不断提升,传统的认证方案已经出现许多不足。基于物理层的安全认证方案(Physical Layer Authentication
学位
随着互联网网络技术的不断向前发展,近年来基于Web的各类在线应用飞速发展,这也为人们提供了一种汇聚群力智慧的新型方式,众包,来解决计算机无法独立解决的问题。由于移动互联网、物联网等技术的快速发展,名为众包的数据管理技术,已经由以在线众包为基础的业务模式向“时空众包(spatio-temporal crowdsourcing)”(也被称作空间众包、移动众包)过渡。随着需求的更加复杂和多元,时空众包开
学位
为应对杠杆率持续攀升可能导致的金融风险问题,2015年底中央经济工作会议首次提出了“去杠杆”政策,之后2018年4月中央财经委员会第一次会议首次提出“结构性去杠杆”的目标,在上述政策的推动下我国企业杠杆率攀升趋势得到了遏制。制造业是典型的高杠杆行业,也是实施“去杠杆”政策的重要行业之一。2015年以来,在国家宏观政策的引导下,制造业企业纷纷采取了去杠杆行动。企业实施去杠杆行为可以有效降低经营风险,
学位
近年来有机功能材料的设计与合成引起了广泛的关注,为此课题组提出了一种与以往有机大环具有明显区别的有机纳米格芳烃化合物。目前已探索的格芳烃主要有梯型格芳烃、风车型格芳烃、菱型格芳烃、井字型格芳烃和缺角型格芳烃。相较于传统有机大环,纳米格芳烃具有更加规整的结构,如可延伸的边长和明确的顶点,同时具有优异的物理化学稳定性和发光稳定性,使其在有机电子器件领域应用广泛。然而,纳米格芳烃在结构与合成上仍存在诸多
学位
“十三五”时期,在新时代中国特色社会主义思想科学引导下,中国经济开始了从高速度发展向高质量发展的转变。当下,高质量发展成为经济社会关注的焦点,其不仅是一个经济发展要求,更是对社会发展的方方面面的要求,其中医疗卫生工作的高质量发展尤为重要。在这样的背景下,关注政府医疗卫生的投入和效率有重要的现实意义,而江苏省作为全国名列前茅的经济强省,研究其政府医疗卫生支出及效率变化对于进一步落实全国医疗卫生高质量
学位
车辆自组织网络作为智能交通系统领域的代表性技术,近年来已经成为学术界和工业界的研究人员非常热衷的研究目标。由于在车辆自组织网络(Vehicular Ad-Hoc Network,VANETs)中,实体间信息的传输大多发生在公开信道,从而使得攻击者能够相对容易地对系统中传输中的消息发起攻击。此外,对于网络中的参与者而言,隐私保护是至关重要的,因为大部分参与提供信息的车辆并不想暴露自己的私密信息。因此
学位
由于股权质押办理流程简单、融资限制条件少、股东控制权不变等优势,故越来越多的上市公司大股东选择股权质押来融取资金。但是,在具有众多优点的同时,股权质押也有着其劣势的一面,一旦金融市场因宏观因素出现大幅波动或者公司陷入负面危机,公司的股价将会出现大幅度波动,此时公司将会面临股权质押风险。为了应对股权质押风险,很多公司会采取市值管理措施以提升股价,比如股东增持股票、进行股权激励、公司股票回购等。现有文
学位
光波导作为微米级别的信息处理的通道,是微型器件集成化后信息传输的桥梁,光波导的性能是决定集成光学系统质量的关键因素。光波导隔离器是基于光波导结构,只允许光信号沿着一个方向传播的微型磁光器件。因此,制备传输损耗低、光学性质优异的波导结构对于推广其在波导型光隔离器的应用方面具有重要意义。本论文使用磁旋光晶体TGG与TSAG作为衬底材料,采用离子注入结合精密金刚石刀切割的方法,制备出宽度不同的二维光波导
学位
固态电池与传统液态电池相比,具有安全性高、能量密度高、力学强度高、循环寿命好等优点。开发具有高机械性能、高离子电导率、优异电化学和热稳定性、以及与电极材料兼容的固态电解质是固态电池发展的关键。石榴石型固态电解质锆酸镧锂(LLZO)由于综合性能优异,如对锂金属稳定、电化学窗口宽、环境友好等优点脱颖而出,但是LLZO通常制备方案复杂且需要高温煅烧。在各类固态电解质中,无机电解质离子电导率高、化学及电化
学位