基于自注意力机制的音源分离模型研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:ruiping009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频音源分离是数字信号处理领域中重要且极具挑战性的难题。音频音源分离旨在于从混合音频信号中分离出目标音源的信号,从而能够进一步方便数字信号处理相关工作的展开。该问题已被研究多年,但相关的算法并没有能够完全地解决该问题,因此对其展开相关的研究意义重大。随着大数据时代的到来和计算机计算能力的提高,深度学习开始在计算机的各个领域大放异彩,研究者们逐渐开始尝试利用深度学习来解决传统方法难以解决的问题。本文选择使用深度学习中的卷积神经网络来解决音频音源分离问题以更好地完成目标音源信号分离任务。本文所做的研究工作主要如下:第一,分析了卷积神经网络由于卷积的局部感受域特性导致的在计算过程中容易丢失全局信息的问题,进而在传统卷积神经网络引入自注意力机制,通过自注意力特征图的计算从而还原丢失的信息。进一步的,还提出了一种双路简化自注意力机制,在降低传统自注意力机制的参数量的同时还能提高使用自注意力机制模型的性能。第二,在第一点工作的基础上,进一步分析了传统基于频带划分方法的模型存在的由于频带划分而导致的频带边界附近信息丢失的问题。为了解决该问题,本文进一步提出了一种新的、具有泛用性的跨频带特征用于改进现有方法。最后,基于所提出的深度学习模型,设计了一个完整的应用系统用于歌曲伴奏的提取工作,并在公开数据集上进行了训练和测试。通过对实验结果进行分析,验证了本文所提出的音频音源分离模型的有效性与实用性。
其他文献
近年来,随着城市轨道交通的不断发展与完善,乘坐地铁已成为越来越多人日常出行的首选。为了更好地辅助地铁运营的精细化客流管理,消除安全隐患,可采用基于监控视频的人群计数系统对地铁站内各个区域的人群数量进行实时估计。现有的人群计数估计方法用于轨道交通场景中,往往存在场景不适应且应用难度较高的问题。本文研究工作便是围绕在地铁站台场景下设计性能优越的基于卷积神经网络的人群计数算法以及支持人群计数的智能摄像头
漏波天线凭借其频率扫描能力和较宽的工作频带,已经成为人们研究的一大热点。本文将复合左右手(Composite right/left-handed,CRLH)传输线结构与基片集成波导(Substrate integrated waveguide,SIW)相结合,对可以实现后向至前向连续扫描的漏波天线进行了研究。设计的漏波天线在边射状态依然可以保持良好的辐射性能,并且后向辐射的范围较宽。主要研究内容如
利用空中目标的毫米波辐射能量实现对目标的探测是一种新颖的探测手段。本文主要针对空中目标的毫米波辐射特性以及对空中目标的探测方法展开研究,主要的研究内容包括:(1)建立地基与星载两种平台辐射计对空中目标的被动探测模型,针对空中目标的辐射特性进行研究。分析了隐身材料的辐射特性,通过对典型的隐身轰炸机目标进行三维建模,利用ANSYS FLUENT对目标的机体和尾焰进行流体仿真,计算分析了目标机体和尾焰的
近年来,无人驾驶技术发展迅速,无论是在民用领域还是军用领域都具有广阔的发展前景。环境感知是无人驾驶系统中至关重要的一个模块,本文主要针对环境感知中三项重要的任务开展研究工作,主要的研究成果和创新点如下:提出了一种基于多线激光雷达的道路检测算法。通过栅格映射和统计高度分布的方法构建改进多属性栅格图,有效滤除空间内噪声点,并将栅格标记为正障碍、悬浮障碍和地面。然后,直接在栅格图中运用自适应圆弧区域搜索
针对低空直升机、地面履带车等低仰角目标,被动声探测技术利用目标运动部件发出的声信号实现探测与识别,能有效解决雷达探测面临的电子干扰、地物遮挡等问题。近年来,随着微机电系统(MEMS)技术的发展,麦克风朝着微型化、智能化的方向发展。采用麦克风阵列形式的小微声探测节点具有成本低廉、结构简单、功耗较低等特点,多个小微声测节点还可采用抛撒等方式大量部署,通过组网进一步构建声学区域警戒系统。基于小微麦克风阵
天线作为发射和接收无线电波的重要设备,很大程度上影响着信号的强度和质量。随着无线通信技术的快速发展,全集成射频电路前端产品的需求日益扩大。射频电路前端大部分是通过差分技术来实现的,但目前绝大多数的天线被设计成单端口元件,不可和差分射频前端直接相连。差分天线改变了传统的馈电方法,可以直接向天线的输入端口馈入差分信号,避免了巴伦等转换元件的使用。这不仅提高了系统的集成度,还减少了不必要的前端损耗,提高
随着智能设备数量急剧增加,终端用户的计算任务需求远超设备本身计算能力。移动边缘计算架构将服务器资源部署在网络边缘侧,可为终端用户提供实时高效的计算服务。而在偏远或自然灾害地区,搭建移动边缘计算架构的成本非常昂贵,可采用移动灵活且无需基础设施的无人机辅助移动边缘计算系统。在此背景下,本文考虑无人机辅助的移动边缘计算架构为终端用户提供计算服务。如何在有限电池容量约束下优化无人机路径是当前研究热点。本文
当前防空系统面临着越来越复杂的作战环境,干扰对抗技术的研制工作迫在眉睫。因此设计一款可扩展性强且接近于真实作战场景的综合抗干扰仿真平台,具有很强的科学研究和工程应用价值。论文设计了一种基于RTX和反射内存技术的分布式协同抗干扰仿真平台。设计了分布式协同抗干扰仿真平台的整体架构,使用c++语言对平台框架进行了搭建与实现,并对平台的性能进行了测试验证。结果显示,仿真平台系统延迟小于10us,数据传输速
雷达数据处理是雷达系统的重要组成部分,其任务是在杂波和噪声背景中快速、准确地获取多目标的航迹。本文以某低空探测雷达为项目背景,对数据处理算法进行了系统的研究,探索最适合本雷达和应用环境的方法,并在高性能的多核DSP TMS320C6678上完成算法的软件实现,发挥产品的最佳性能。本文首先说明雷达数据处理的整体流程,对参数估计使用的卡尔曼滤波进行仿真。然后结合项目要求,深入探讨了以下四个关键环节,为
本文以某频扫雷达项目为背景,设计了一套针对低小慢目标的雷达数据处理算法软件和显控软件。主要工作包括以下内容:本文首先介绍了雷达数据处理理论算法,主要包括点迹凝聚方法、航迹起始算法、线性滤波算法以及航迹互联算法中单目标跟踪与多目标跟踪算法。其中主要介绍了航迹起始中的修正逻辑法与修正的Hough变换算法,线性滤波中的卡尔曼滤波算法,单目标互联中的NNSF算法和修正的PDAF算法以及多目标互联中的次最优