基于非负矩阵分解的单通道音乐分离研究

被引量 : 0次 | 上传用户:funkfood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐的创作、表演是人类最复杂的文化产物。近年来,随着自动音乐分析、重组和海量音乐数据检索需求的日益增长,导致从多声部混合音乐信号中分离出特定乐器信号变得尤为重要,而单个麦克风的音乐录制是极其普遍的,所以本文研究的重点是从单通道线性瞬时混合音乐中分离出乐器信号。非负矩阵分解(Nonnegative Matrix Factorization, NMF)算法能够有效地将音乐频谱分解为若干基本音符成分,但多个乐器同时演奏时,不同乐器源的时频混叠十分严重,同时未存在有效的聚类算法将分解后的音乐成分归类为所属乐器源,为此本文从以下两个方面进行了研究:针对NMF算法分解音乐成分不易聚类的问题,本文给出了MIDI.乐谱监督下的板仓-斋藤非负矩阵分解(Itakura-Satio Nonnegative Matrix Factorization, IS-NMF)的音乐源分离方法。该方法首先将不同乐器的MIDI乐谱合成为音乐信号,并采用IS-NMF算法从不同乐器的合成音乐中学习音乐成分,然后将所得的音乐成分分别初始化IS-NMF分解混合音乐频谱的基矩阵与增益矩阵,最终维纳滤波分解成分获得估计的源乐器信号。仿真实验表明该方法相比于其它乐谱监督下的分离算法在分离评价指标上有明显改进,但增加了时间复杂度。为了减少乐器间的时频重叠,本文采用了由传统NMF算法拓展的二维稀疏非负矩阵分解模型(Two-Dimension Sparse Non-negative Matrix Factorization, SNMF2D),针对SNMF2D直接分解混合音乐频谱所导致的乐器成分模糊问题,本文引入经验模态分解(Empirical Mode Decomposition, EMD)算法对时域混合音乐信号进行预处理,将混合音乐分解为若干本征模态函数(Intrinsic Mode Function, IMF),并根据每阶IMF分量的混合度,最优地调整稀疏权重因子,同时利用SNMF2D算法对每阶IMF成分的频谱进行分解,接着每阶IMF分量的时域子源经掩蔽算法及短时傅里叶逆变换估计得到,最终将时域子源信号聚类为相应的乐器源。计算机仿真实验表明该方法相比于直接利用SNMF2D算法略有提高。
其他文献
飞机积冰是一种危害飞行安全的天气现象。如何有效预防飞机积冰是一个值得研究的问题。本文通过对积冰事故的分析及民航业发展需求的介绍,阐述了研究积冰区划分的必要性,总结
通过理论和实验数据的比较,得出鲁奇炉加压升温开车的优点,消除了常压升温存在的问题,对开车操作提出了改进意见。
以中共十八大关于“美丽中国”发展思路为契机,全面贯彻科学发展观,构建资源节约型和环境友好型社会,坚持走新型工业化道路,促进循环经济的发展,建设生态文明,构建中国特色社
目的观察小骨窗经外侧裂手术治疗基底节区高血压脑出血的疗效,并与传统骨瓣开颅血肿清除术对比,探讨其临床推广运用价值。方法回顾性分析符合要求的本院2010年1月——2012年6
随着篮球运动不断的发展与演变,三人制篮球项目已经在世界各地悄然发展起来,并且逐渐成为广大青少年最喜爱的体育运动项目之一。本文通过文献资料法、逻辑分析法探讨三人制篮
本文根据国家统计局2003—2012年城乡居民收入历史数据回溯调整方法,对CHIPS(2007)微观家户数据进行了调整;并使用国家统计局的基尼系数计算方法,对中国居民收入基尼系数进行
目的:研究莪术水提物对大鼠缺血性脑卒中的治疗作用,探究其作用机制,为莪术的临床应用提供药理学依据,拓展莪术的临床用途。方法:健康成年雄性SD大鼠60只,体重260±20g,随机分
目的:观察痰热清注射液治疗小儿手足口病(普通型)的临床疗效。方法:对2011年9月-2012年9月,于哈尔滨市儿童医院感染科住院并确诊为手足口病的122例患儿随机分为治疗组和对照组
壳聚糖是自然界中第二大类丰产资源甲壳素脱乙酰化的产物,也是食品工业中的重要原料之一。壳聚糖后加工产品的进一步开发与应用是避免自然资源浪费、扩大壳聚糖应用范围的途
目的:分析健康体检人群不同部位骨密度(Bone mineral density, BMD)、骨矿含量(Bone mineral content, BMC)与体成分的关系,探讨体成分变化对BMD、BMC的影响。方法:收集2010年3