论文部分内容阅读
音乐在人类的生活中一直扮演着不可或缺的角色,也是人类文化历史的重要载体。而多基频估计在音乐信号分析中也是不可缺少且至关重要的一部分,它可以被用来音乐旋律和调式的识别,广泛应用于音乐检索、音乐分离和自动音乐标注领域。音乐信号具有较强的频谱层次性和时间递变性,这使它与其他音频信号存在着根本上的差异。演奏类似与钢琴的多声部乐器时,主旋律音与伴奏音在时间上具有不同的递变性,这样不同频率成分的音符频谱发生重叠;另外低音基频间隔太小和基频消失等都造成基频估计的困难,目前时、频域信号处理方法都存在一定的不足之处。尽管如此,相关学者从不同角度出发进行多基频估计的研究,提供了诸多思路,如利用人耳听觉系统特点解决频率偏移的问题,用较高的频率分辨率进行低音区音符的识别。本文的研究是建立在多基频估计领域众多学者优秀的研究成果之上。主要工作如下:1、论文分析了常见的几种时频分析技术,最终选择了谐振时频分析(Resonator Time-Frequency Image, RTFI), RTFI能够实现多种分辨率,可以被用来实现均匀分析,恒Q分析等,本文将RTFI应用到音乐信号的处理当中,并实现了音乐信号的RTFI的恒Q分析。2、为了实现钢琴音乐的音符切分工作,需要进行端点检测,论文对比分析了几种检测函数。本文主要研究连续钢琴乐曲的多基频估计,钢琴属打击类乐器,演奏音符为“重音符”,所以文中采取基于频谱差值的检测函数,并经过滑动均值滤波,完成峰值提取实现端点检测,完成音符切分。3、音符切分后,设计滤波器组,将滤波器组分到不同的八度频带内,实现多分辨率的快速RTFI分析,根据基频能量谱和相对能量谱进行多基频估计,算法在端点检测的基础上首先对多基频进行初步估计,然后根据谐波之间的关系以及频谱的不规则性进行筛选候选基频。文中对比了Klapuri的迭代估计算法,对合成多音符信号和录制钢琴乐曲分别进行多基频估计,并作出结果分析,本文算法大大减少了计算量,提高了基频估计的效率。