混合乐音信号分离方法研究

被引量 : 0次 | 上传用户:yiwangcom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文要研究的混合乐音信号分离是指从多音混合音乐信号中分离得到参与演奏的各个乐器或某个特定乐器的声音。乐音分离系统在很多领域都有其应用,如乐器辨认、旋律提取、乐音信息检索、自动乐音分离及乐音转录等,混合乐音分离在近几年越来越受到人们的关注。本文简要介绍了混合乐音分离相关的基础知识,传统的分析和综合技术及分离技术评价标准等。本文将混合乐音分离技术分成分流法和分解法两大类,并在文中介绍了各类算法的思想。分流算法中介绍了三种分离技术,包括基于正弦模型的乐音分离、基于听觉场景分析的乐音分离和基于KNN聚类算法的乐音分离。分解算法中介绍了两种分离技术,包括基于频谱滤波的乐音分离和基于非负矩阵分解的乐音分离。本文中采用的正弦模型技术是较为传统的一种方法,峰值匹配同时采用了基于音高的谐波轨迹曲线算法和综合考虑音高和幅度信息的改进算法。其中,改进算法得到了更好的分离效果。计算听觉场景分析采用了Gammatone滤波器和掩蔽滤波来分离信号。K最近邻的信号分离算法中,较多地采用了乐音信号的先验信息,一定程度上可实现信号分离。分解算法中的滤波分离方法基于乐音信号的谐波性设计滤波器组,分别从频域抽取和时域滤波两个层面实现信号分离。非负矩阵分解采用梯度下降算法得到的基谱在音色空间上并不是完全独立的,容易造成分离信号失真。本文提出了基于音高修正基谱的方法,一定程度上改善了分离效果。本文对上述五种分离算法进行了仿真实验,并分别从主观评价、客观评价和总体评价几个方面对比分析了各算法的分离性能。本文中,主观评价方法采用的是平均意见得分法,客观评价方法采用了信噪比、相关系数和峭度三个指标。
其他文献
目的:通过分析结直肠癌患者手术前后外周血CD4^+CD25^+T细胞水平与直肠癌患者细胞免疫状态、生物学特征的联系,以及手术对外周血CD4^+CD25^+T细胞水平变化的影响,评价结直肠癌患者
医生常嘱咐病人要多饮水 ,是何道理呢 ?原来 ,服用的药物均是先溶于水 ,然后被吸收入血液 ,再运往脏器组织发挥作用。而体内的细菌、病毒及其毒素等 ,也需要水作溶媒稀释后排
期刊
随着现代工业的发展,对带钢的需求日益增加,目前决定带钢生产质量的主要因素是板形控制器的控制精度,而能否设计合理的板形控制器算法是带钢板形质量提高的关键。本文主要研究板
基于序数效用的匹配决策是对市场价格决策机制的有力补充,具有重要的研究意义。文章将匹配要素分为匹配主体、匹配物、匹配算法、匹配集,从而规范了匹配决策的研究体系。在对
阐明土壤抗生素的空间分布特征对于认识抗生素的空间扩散和迁移过程、控制土壤抗生素污染、维护土壤安全具有重要意义.本研究通过空间采样,系统分析了长三角地区典型城郊流域
人体部位字因取象具体,大多为象形字或以象形部件为主要构件。它们与人类密切相关,多为核心词,产生年代久远,多数沿用至今。字形变化主要是为适应书写便捷、协调的需求而进行
热预弯冷却是钢轨生产过程中的重要工艺环节,由于钢轨截面形状比较复杂,在冷却过程中温度分布不均匀,使各部分收缩量不同,导致钢轨产生较大的弯曲变形。后续的矫直工艺与预弯冷却
甘草甜素具有抗变态反应、抗炎作用,主要用在皮肤科领域治疗多种过敏性皮肤疾患及治疗慢性肝病,改善肝功能异常。2002年,熊田博光报道了长期应用复方甘草甜素对500多例慢性丙
我国农产品出口企业进入世界市场的时间短,经营规模小,信息渠道不畅,政府扶持有限,抗风险能力很弱,必须通过参与国际农产品贸易规则的谈判、加大对外交涉、推广出口信用保险
高频射流实验装置是采用脉冲微射流控制燃烧的,是一种控制射流及火焰的创新型主动控制方法,它能在有限的时间内极大限度地提高燃料燃烧的充分性和稳定性,降低燃烧产物对环境的污