自动音乐识谱技术研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:cbxabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动音乐识谱(AMT)即自动将音乐信号转换成某种乐谱形式的过程,它被认为是音乐信号处理中关键性的问题,但同时也是一个复杂而且具有挑战性的问题,目前对于多音音乐的自动音乐识谱还没有能达到人工识谱效果的系统。自动音乐识谱技术在自动音乐伴奏、高级音乐编辑技术、音乐检索、音乐教学等领域有着广泛的应用。本文将自动音乐识谱过程分为两个主要的子任务:多基频估计与多基频流化,并分别对它们进行研究与改进,下面是本文主要的研究工作与创新点:(1)基于统计模型的多基频估计本文采用最大似然概率的方法来进行多基频估计,以频谱上的峰值点作为观察值,而将基频作为需要估计的参数。在训练模型时,为了充分利用频谱上所有区域的信息,本文对参数模型进行修改,加入了峰值点以外区域的信息,从而与峰值点区域信息形成互补,前者被用来确定基频应该出现的位置,而后者被用来确定基频不应该出现的位置。在多基频估计时,针对似然概率估计的基频个数估计问题,本文采用假设谐频序列(HPS)方法,计算谐频的幅值与频谱平滑度,考虑基频组合中谐频间的相互干扰,从而根据频谱能量与平滑性选择最优的基频组合。最后采用相邻帧的关系来进行后处理。实验结果表明相关的改进和后处理可以取得更好的多基频估计效果。(2)基于音色特征的多基频流化本文采用基于音色特征的方法来进行多基频流化,将其建模为一个受约束的聚类问题。并且以梅尔倒谱系数特征(MFCC)、谐频结构特征(HS)、普通倒谱特征(OC)、离散倒谱特征(DC)作为音色特征进行研究。为了保证相同乐器源所关联的音色特征具有相似性,而不同的乐器源所关联的音色特征具有更好的区分度,本文对DC特征进行改进,并提出一个新的特征,离散均匀倒谱特征(UDC),实验结果发现UDC特征可以取得更好的效果。同时在聚类算法的初始化时,不同于传统的采用随机初始化来聚类,本文采用按基频大小顺序来进行初始化聚类。通过实验发现,在结果相当的情况下,可以大幅度减少算法的迭代次数,从而提高算法的效率。
其他文献
当终端由于尺寸、成本、功率或复杂度限制而不能安装多个天线时,无线通信系统就无法采用多输入多输出技术来提供空间分集。这时,协作通信是一种极具吸引力的替代技术,它可以有效
目前,传统的保密柜、保密箱、门禁等配合视频监控设备的方式虽然提供一定程度上的安全保护,但是不能处理各种来自内部、外部的安全威胁。因此,为了满足对涉密文件、重要物资
随着环保的普及,近些年,绿色建筑己渐渐成为建筑行业发展关键性的一部分,同时这类新型的建筑尤其与现在人们的生产生活相匹配.不仅提高了人们的生活舒适度,也提高了人们的生
虽然传统的空时分组码可以带来分集增益以及提高系统的容量,但是多发射天线的使用增加了符号间干扰以及多址干扰。利用结合空时分组码的波束形成可以有效地减少符号间干扰和多
电缆在线质量监控的重要环节是电缆偏心检测,电缆一旦偏心将造成原材料的巨大浪费,另外还将直接影响电缆的性能。X射线检测是在现代工业生产中应用非常广泛的一种无损检测的方法,它对于提高电缆的质量和安全性有着重要的意义。本文对利用X射线无损检测法进行的电缆偏心的实时检测系统进行了研究。本文以电力电缆偏心在线检测系统的开发研制为主要内容,文中首先介绍了国内外电缆偏心测量装置的研究现状,着重介绍了X射线检测的
随着计算机网络、流媒体技术的发展及相关协议标准的成熟,基于网络的视频监控系统正成为蓬勃发展的一种新的网络多媒体典型应用。采用流媒体技术的视频监控系统具有视频的数
Ad Hoc网络是自组织、无中心控制节点和无固定基础设施支持的网络,具有组网速度快、抗毁自愈能力强等优点,在军用和民用方面均有广泛的运用背景。这种网络强调多跳和无中心接入
建筑工程造价预结算在建筑工程建设的过程中扮演着非常重要的角色,其中人们最为关注的是预结算审核管理工作,所以,首先需要处理好这项工作的管理,只有这样才能够在资源最小程
随着科学技术的发展,出现了一种新型的无线传感器网络(WSN)。它由很多具有集信息采集,数据处理和无线通信为一体的传感器节点组成。各个节点相互协作,并将采集得到的外界环境
地震勘探对地震检波器性能的要求逐渐提高,传统加速度传感器在信号采集、信号处理和信号传输等方面,存在精度低、功耗大等不足。本文研究的数字化检波系统将光波导技术和嵌入式