音乐中人声分离研究

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:allen75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于数字音乐的快速发展,歌手识别、歌词对齐等技术需求不断增加。人声分离作为这些技术的一个重要组成部分,受到越来越多的关注。精确的人声分离能够有效地提高歌手识别、音频检索等技术的准确度和实时性。人声技术对于音频信号处理领域有着重要的研究价值。本文主要在矩阵分解的人声分离理论框架下,对基于非负矩阵分解、鲁棒主成分分解和低秩分解等人声分离技术进行了详细的研究。在此基础上,重点研究了鲁棒主成分分解技术,针对其不足提出了一种两步矩阵分解的人声分离算法。最后,为了对人声和伴奏部分进行更好的表达,本文使用一种深度神经网络的人声分离算法,可以有效提高人声分离的准确性。本文的主要研究工作及创新点如下:1.基于矩阵分解人声算法的研究1)首先研究了基于矩阵分解的人声分离算法,总结了矩阵分解算法的基本框架,对典型的矩阵分解算法,如非负矩阵分解算法、鲁棒主成分分析和低秩分解等算法进行了研究并仿真实验。结果表明,基于鲁棒主成分分析的人声分离算法对伴奏分离较彻底,且有很强的鲁棒性,综合表现效果最佳。2)针对鲁棒主成分分析的人声分离中的人声分离不彻底的问题,本文研究了一种基于两步的矩阵分解的音乐分离算法,首先使用鲁棒主成分分析的人声分离算法对音乐进行初步分离,然后引入谐波源分离算法针对分离出的不彻底人声进行二次分离,最后将两次分离的结果重新组合,即得到最终分离出的伴奏部分和人声部分。实验结果表明,基于两步的矩阵分解的音乐分离算法在保证原有算法鲁棒性的前提下,有效提高了分离的性能。2.基于深度学习的人声分离算法的研究针对矩阵分解算法对伴奏部分表达欠佳的问题,本文在深度学习理论基础上研究了一种基于深度神经网络的人声分离算法。由于深度神经网络能够使用逐层学习和非线性激活函数,所以能够对人声和伴奏进行更好的表达。同时,为了使得深度神经网络更好地利用音乐上下文信息,本文研究了一种基于深度循环神经网络的人声分离算法。实验结果表明,基于深度循环神经网络的人声分离算法能够较彻底分离出人声与伴奏,且稳定性较高。
其他文献
本文结合漏水信号的特点,分析了噪声在漏水定位中的危害并提出两种去噪算法:谱减法和最小均方误差自适应算法(LMS)。本文分析了六种谱减法形式,并利用matlab仿真分析,最后将算法
微多普勒现象是由目标微动产生的,对于运动的雷达目标,目标本身或部分常常伴随有微动。目标的微动会对雷达回波信号产生微多普勒频率调制,其微多普勒唯一的反映了目标的运动
被动跟踪技术因无须在目标上加装合作信标,从而能够大大提高试验效率。传统被动方式的轨迹跟踪系统因测距精度差、跟踪速度慢等局限性,一直未成为装备定型试验的主力设备。随
Ad Hoc网络无需固定基础设施的支持,具有组网方便快捷、可靠性高、灵活性强等优点,其应用越来越广泛。随着各种智能化、小型化的无线终端和智能家庭终端大量出现,它们之间的