论文部分内容阅读
伴随着互联网与软硬件的快速发展,音乐的制作和传播变得越发高效和便捷,导致音乐数量呈爆炸性增长。音乐数量的快速增加,促进了对更多样、更高效的音乐检索方式的需求。基于哼唱的音乐检索是一种新型的音乐检索方式,它属于基于内容的音乐检索方式。本文研究的哼唱检索系统的哼唱音频是WAV格式,数据库中歌曲是MIDI格式。哼唱旋律提取、哼唱位置确定和旋律匹配是哼唱检索过程中最重要的三个环节。本文围绕评测准确度指标MRR(Mean Reciprocal Rank)展开,并在IOACAS哼唱数据集与10000首MIDI歌曲组成的数据集中测试。在哼唱旋律提取和旋律匹配方面,本文的主要研究工作和创新点如下:(1)在哼唱旋律提取部分,提出一种基于多个概率分布的方法计算PYIN(Probabilistic YIN)算法中的观察概率。该方法对周期稳定性不同的音频使用不同的概率分布计算观察概率,降低了PYIN基频提取算法将倍频错识别为基频的概率,并提高了对噪声的鲁棒性,使MRR指标从64.2%提高到67.5%。(2)在旋律匹配部分,提出一种基于切割点对齐的旋律匹配算法。该算法采用音符切割点对齐规则并利用动态规划算法求解最优对齐路径,充分地利用了每个切割点的信息,对音符的误切和漏切问题具有很好的鲁棒性,可以更好地利用旋律的节奏信息和有效地提高旋律匹配的区分能力,使MRR指标进一步提高到78.9%。(3)在旋律匹配部分,首先提出一种改进DTW算法,改进后的DTW算法增加了每个点对齐次数的约束,可以在不约束横轴的情况下避免过度扭曲的现象发生。然后提出一种基于改进DTW算法获取候选旋律的方法,该方法利用改进DTW算法查找候选旋律的起止点,可以更准确的找出候选旋律,使MRR指标进一步提高到80.2%。