【摘 要】
:
音乐旋律的简谱或五线谱表示是人们常见的音乐旋律的标准符号化表达。而MIDI音乐文件则是音乐旋律的另一种符号化表达形式。哼唱转MIDI自动记谱(Automatic Music Transcripti
论文部分内容阅读
音乐旋律的简谱或五线谱表示是人们常见的音乐旋律的标准符号化表达。而MIDI音乐文件则是音乐旋律的另一种符号化表达形式。哼唱转MIDI自动记谱(Automatic Music Transcription)是一种让计算机抽取人声哼唱音频信号中所描述的旋律信息(音符音高序列及其时长序列)并将其自动转化为符号化的MIDI乐谱的技术。这项技术的主要难点在于如何让计算机在一个哼唱得不是太准确的人声哼唱音频信号中寻找哼唱者所期望的正确旋律表达,并将其转化成MIDI乐谱格式。现有不少哼唱转MIDI自动记谱系统(如WIDI Recognition Syste等)由于无法对出现在结果中的大量不正确的短时音符进行合并、规整以及泛音过滤等方面的处理,以致其结果无法转化为利于管理、分析和应用的符号化、标准化的MIDI乐谱。
本文提出一种基于倍音列的音高计算模型。在此基础上,针对Krumhans1[1.2]调式识别模型的缺陷,提出一种基于哼唱的调式音阶参数训练方法,训练得到的参数模型能够使调式识别的第一命中率达到90%(参见附录调式识别实验结果),最后根据人听觉的差异特性,即相对听觉误差,提出了一种浮动音高的规整方法,用于调整旋律音高识别过程中出现的半音到全音的识别误差,从而最终有效的实现旋律音符75%左右的正确识别(其余的误识音符可以通过人机交互来调整)。
在哼唱转MIDI自动记谱技术应用方面,探索性地提出了一种哼唱识别检索系统数据库的构建方法,该方法具有较强的实用性。
结合以上的理论研究和算法,实现了一个哼唱转MIDI自动记谱系统,为自动记谱技术的研究打下了一定的基础,对进一步的深入研究具有推动和借鉴意义。
其他文献
随着我国现代化的进一步深化,对铝合金产品的数量和质量都有了很高的要求。在铝合金的半连续铸造过程中,将功率超声波导入其熔液中能够显著地改善凝固组织的微观结构,提高产
倒立摆自上个世纪50年代,被麻省理工学院的控制理论专家根据火箭助推器运行过程中的特点和原理首次提出,引起科学界的广泛关注。因为倒立摆具有不稳定、非线性、强耦合、多变性
随着社会经济的发展,机场对地区竞争力的提升作用日益凸显,此种作用的发挥使得机场逐渐成为地区社会经济发展的“瓶颈”。同时,在社会总资源约束下,民用机场的过度发展可能会
随着社会的发展,能源问题已经越来越受到了人们的关注,能源是人类赖以生存的基础,也是经济和社会发展的物质保障。近年以来,随着一次性化石能源煤炭、石油、天然气开采殆尽,
复卷机作为造纸工序上最后一个环节,是形成成品纸卷优劣的关键的一部分。本文主要是从成品纸卷的的质量要求出发,分析影响成品纸卷质量的因素,并且逐个进行分析、研究和优化,
现代化港口码头的高速发展,需要大量的高强度、高效率的机械化设备投入使用,从而引起了港口用电量的快速增长。电力消耗已成为港口生产最主要的消费支出,占生产成本的比重越来越
供电整流系统是整个铝电解系统的核心,而供电质量的最重要指标,为电流的自动稳定。保持电解电流的稳定,可以提高铝电解过程的电流效率,减少电能损耗和阳极效应的次数。论文针对铝电解整流系统的特点和工艺要求,以中南大学冶金科学与工程学院井式铝电解炉电源的开发为背景,选择了晶闸管自动稳流方案,主电路设计采用三相桥式全控整流电路,并且提出了基于C8051F020单片机的模糊自适应PID控制策略。系统硬件设计共包
飞秒激光双光子微纳加工具有真三维加工能力和亚微米分辨率等技术特点,在微机电系统(MEMS)领域受到越来越广泛的重视。然而,随着MEMS技术的飞速发展,传统的飞秒激光串行加工方式
在雾天条件下,户外环境的视觉系统获取的图像的对比度和颜色会出现严重的退化,使得民用领域或是军事领域中很多重要的监控系统难以正常工作。因此在计算机视觉系统中,有必要引进
在过程控制领域中,控制回路约80%-90%采用单回路PID,然而在一些大型的复杂的工业生产过程中,系统的各个变量之间存在关联,某变量的调节必然影响其它变量,此时单纯采用单回路PID控制,