论文部分内容阅读
音乐哼唱检索研究是基于内容的音乐检索的一个分支,它是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在internet音乐检索以及生活娱乐等方面都具有非常重要的意义。
本论文围绕基于旋律的音乐哼唱检索技术,对哼唱检索技术的数据库音乐的处理、哼唱音乐的处理和特征相似度匹配三大方面展开研究工作,主要包括:
1)介绍音乐乐理知识、音乐的相关概念,介绍音乐旋律的各种特征表示,通过比较确定本系统采用的三维旋律特征。
2)总结从MIDI格式文件中提取音乐旋律的优点,确定MIDI格式作为数据库音乐文件格式,并实现了在MIDI文件中确定歌曲主旋律的算法。
3)介绍音乐信号分析知识,对音调提取所用到的语音信号处理的概念、算法和信号特征进行了详细描述,并提出了对哼唱音乐片段处理具体的算法和实现步骤。算法考虑到人们的哼唱习惯和实际处理中碰到的问题,使得对哼唱音乐的处理更加准确。
4)首次提出基于维特比(Viterbi)算法的匹配检索算法,并在此基础上提出了基于维特比的分级匹配检索算法,该分级匹配算法先进行旋律轮廓的字符串模糊匹配,再进行基于维特比(Viterbi)算法的匹配检索,最后结合音高差和音长的相关度。实验证明基于维特比的分级匹配算法有较好的稳定性和容错性。
5)详细分析实验结果和实验数据,总结了系统的优点和缺点,并和其他算法进行比较。
音乐哼唱检索系统的研究具有广泛的实用价值和理论研究价值,也是极富挑战性的研究领域。本论文的工作为音乐哼唱检索研究打下了一定的基础,对进一步的深入研究具有推动和借鉴意义。