音乐信号中的人声伴奏分离研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jovin_chow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的到来,海量数字音乐下的音乐标注、检索、识别、歌声基音跟踪等音乐信号处理技术的需求不断增加。其中,音乐信号中的人声伴奏分离作为这些技术研究的前期处理,日益受到关注。一个良好的人声伴奏分离系统能为后期处理带来便捷以及提供良好的性能保障,故具有重要的研究价值。然而人声伴奏分离技术不同于音频信号中的去噪分离技术,其间的相互干扰给学术研究带来了不少挑战。本文主要研究音乐信号中的人声伴奏分离问题,包括以下几个方面:(1)为解决非负矩阵分解(Non-negative Matrix Factorization,NMF)在人声伴奏分离中适应性差且过度依赖学习样本的问题,研究了一种结合谐和与击打声源分离(Harmonic Percussive Source Separation,HPSS)的NMF人声伴奏分离方法。首先,在高分辨率下通过HPSS算法对音乐信号进行声源分离;其次,保留谐和声源并利用灵活窗NMF算法对击打声源进行二次分离;最后,对结合理想二元掩蔽模型(Ideal Binary Mask,IBM)分离出的伴奏及人声的频谱作相应的傅里叶逆变换。研究表明,根据两种分离算法在人声伴奏分离上的优缺点,将它们结合到一起能够有效地扬长避短,提高分离性能。(2)针对音乐信号中的人声与伴奏相互关联难以分离的问题,研究了一种基于区分性训练深度神经网络(Deep Neural Network,DNN)的人声伴奏分离方法。首先,在DNN模型的基础上同时考虑人声与伴奏间的重建误差和区分性信息,研究了一种改进的区分性目标函数;其次,在DNN模型上额外添加一层,引入时频掩蔽对估计出的人声与伴奏进行联合优化,相应的时域信号由傅里叶逆变换获得。研究表明,DNN模型能够获取音乐信号的特征,分离性能得到较大的提高。(3)根据深度循环神经网络(Deep Recurrent Neural Network,DRNN)具有强大的动态建模能力,即利用过去信号的时间依赖关系分析数据特征,从而可以对当前或者未来信号进行合理预测,研究了一种基于DRNN的人声伴奏分离方法。在DNN结构下的人声伴奏分离方法的基础上,利用区分性目标函数区分训练DRNN参数,并引入时频掩蔽模型联合优化得到DRNN模型。研究表明,基于DRNN结构下的人声伴奏分离模型能较真实地反应音乐本身信息,能较大提高分离性能。
其他文献
果胶酶是分解果胶的多种酶的总称,可用于植物纤维中的果胶质的分解。碱性果胶酶指在碱性条件下,能够解聚果胶物质a-1,4糖苷键的酶,一般多指聚半乳糖醛酸裂解酶(PGL)。它除在植
目的:颈动脉粥样硬化(carotid atherosclerosis,CAS)作为研究2型糖尿病大血管病变的窗口之一,拟观察血清胱抑素C与2型糖尿病颈动脉粥样硬化之间的相关性及危险因素,对2型糖尿病大血管病如心、脑大血管事件的发生发展尽早诊断、治疗具有十分重要的意义,进一步为2型糖尿病大血管病变发病机制的相关基础研究提供支持依据及新的思路。方法:根据入选及排除标准在永州市中心医院南院代谢内分泌科选
年节,是当地村落互赠礼物最频繁的时期。鼓子秧歌是当地村落只在年节期间表演的大型民俗活动。本文将当地鼓子秧歌这一民俗活动放置在年节期间村落礼物交换语境中加以深描,从乡村仪礼的视角解读村民在庙前祭拜、村际串演、政府门前汇演的秧歌民俗活动,阐释了在现代化进程中跑秧歌群体的变化、跑秧歌的动因以及鼓子秧歌本体的变迁。全文共分为绪论、正文四部分和结语:绪论主要介绍研究目的和意义、相关研究综述以及研究方法。第一
近年来,政府各部门大力支持食用野生菌产业发展,野生菌的年产值不断增加,成为农民收入的主要来源和脱贫致富的重要途径。但伴随着野生菌产量的增加,野生菌中毒事件频频发生,
LNG液化天然气具有性能高、热值大、清洁、高效、节约储运空间等特点。作为清洁能源越来越受到青睐,目前,液化天然气是继煤和石油之后的第三大能源,是未来能源发展的重点。很
傅立叶变换是调和分析中的一种基本变换,它不仅是一种有效的数学工具,而且在信息、控制与计算机领域取得了广泛的应用,这主要归结于其直观性、数学上的完美性和计算上的有效
所谓代数特征值反问题,就是在一定的限制条件下,根据给定的特征值或特征向量决定矩阵的元素,它是在物理化学中研究分子结构时发现的。矩阵特征值反问题在数学物理反问题的离
目的通过临床观察STEMI-PCI术后心力衰竭气虚血瘀证的患者服用益气活血膏加减方前后使用超声心动图脉冲多普勒方法测定的患者左心Tei指数改善水平百分比,探索STEMI-PCI术后心力衰竭气虚血瘀证患者在标准的西医药物治疗基础上加用益气活血膏加减方,改善患者左心Tei指数的情况,进而评价益气活血膏加减方是否对STEMI联合PCI术后心力衰竭气虚血瘀证患者左心功能的改善带来了确切的疗效,帮助改善患者
消费者在线评论,借助网络广泛传播,极大地影响着潜在消费者感知可信性和购买意愿,并形成网络口碑进而影响企业形象。然而,作为企业形象修复的手段,企业致歉很少从中美对比的
机床在加工过程中会出现不可避免的振动。振动会影响加工精度和质量,甚至可能引发共振,从而降低机床的使用寿命。因此,研究机床的振动特性十分必要,这为后期机床性能评价、精