论文部分内容阅读
随着数字科技的发展,MP3凭借极高的压缩比与极小的失真,成为目前最受欢迎的数字音乐压缩格式,广泛在网络上流行。从大量的MP3音乐资料中检索出自己想要的歌曲,目前只能通过查询歌曲名或歌手名等信息进行检索。如果仅仅是知道一个曲调,就无法搜索到自己想要的歌曲。本文针对这种现况,主要对MP3音乐的哼唱检索进行了研究,使用户只要通过麦克风哼唱一首乐曲的旋律片段,就可以得到所要检索的MP3音乐。目前对哼唱检索系统的研究大部分都是对MIDI格式的检索,对MP3格式的处理研究的较少,另外对哼唱的要求多数是要求用特殊的哼唱方式,对于连续哼唱和带歌词哼唱研究较少。即使采用了连续哼唱的方式,也是提取出旋律轨迹信息后,使用用字符表示法表示,用字符匹配法进行匹配。在对哼唱信号的基频提取上,多数研究使用传统的方法对哼唱输入信号进行基频提取,在提取的过程中会出现种种的问题,对旋律轨迹的准确性造成一定程度的影响。由于连续哼唱方式下旋律轨迹数据量大,所以需要设计一个快速的旋律匹配算法进行旋律匹配计算。针对上面的问题,本文进行了如下的工作:在哼唱输入信号的特征提取模块中,对传统的基频提取算法进行了研究,发现了传统的基频提取算法中存在着各种各样的问题,针对要处理的带歌词哼唱和不带歌词哼唱两种哼唱输入信号,提出了一种小波变换结合自相关函数法对哼唱输入信号进行分析,提取基频轨迹的方法;在MP3旋律特征库的建立上,考虑到一首歌曲中最令人难忘的部分是人声演唱部分,所以首先对MP3音乐进行了预处理,将音乐中的人声信息提取出来,然后将人声部分的MP3音乐进行解码,在解码过程中提取基频;提出了一种精确音程表示法来表示旋律轮廓,使用音程表示法表示MP3旋律轮廓,并根据旋律轮廓建立MP3的旋律特征数据库;在旋律匹配检索模块中,提出了一种数值索引的方式,对旋律特征库中的音程信息建立索引,优化了动态时间规整(Dynamic Time Warping,DTW)算法;设计了一个基于哼唱的MP3音乐检索系统,针对各个模块进行实验模拟分析,证明了提出方法的有效性。