论文部分内容阅读
音符起始点检测问题是音乐信号分析与处理的基本问题,是基于内容的音乐检索系统的关键环节,尤其是哼唱检索系统,每个音符起始点的检测精准度在很大程度上影响了基于内容的音乐检索系统的准确性。现在音符起始点检测方法大都是在语音端点检测方法的基础上加以改进的。本文首先对音乐起始点检测的研究背景及意义进行了全面的介绍,总结出国内外研究人员的对该课题研究的四个重要步骤:预处理、特征提取、选取特征方程、峰值提取。然后对每一步骤做了详细的说明,介绍了几种经典的检测算法,并分析了利弊。最后,提出了更有效的全新的音符起始点检测算法——基于Constant Q变换的检测算法。该方法在Constant Q变换的基础上,将频谱能量与子带谱熵相结合,提出了一种新的计算距离的方法,再通过分层次归一的方法优化检测函数。在音频信号处理中,为了观察高频现象发生的时间位置,应该使用窄时域窗;为了了解低频现象,应该使用宽时域窗;短时傅里叶变换总是使用相同长度的窗,而Constant Q变换可以自动调节窗口长度,且频率点分布符合音乐的音阶分布。本文就是从Constant Q变换的角度出发,频谱能量能很好的反应音乐信号的变化,但是对于“软”音符,其频谱能量变化并不明显,而谱熵与音乐信号的随机性有关,与信号的幅度无关,对于“软”音符,它的谱熵不一定小,正好弥补了基于频谱能量方法的缺点,子带谱熵不仅继承了谱熵的优点,又有一定的抗噪性能。本文将频谱能量与子带谱熵这两个特征参数相乘,用一种新的计算距离的方法建立联合检测系统,得出的音符起始点时间更加精准。最后提出了一种新的优化检测函数的方法——分层次归一,使得峰值更加明显,有利于通过固定阈值的方法提取局部最大值。在仿真阶段,对不同类型的音乐片段进行仿真,分别用基于短时傅里叶变换的频谱差异的方法,基于Constant Q变换的频谱能量、子带谱熵、频谱能量与子带谱熵之积的方法对音乐片段进行仿真,分析仿真结果。实验分析结果表明本文提出的算法检测效果更加明显,有一定的优越性。