论文部分内容阅读
随着数字音乐技术的迅猛发展和手机等移动设备存储容量的增加,如何快速、有效地检索音乐信息成为迫切需要解决的问题。传统基于文本的检索方法,只能对有标注的数据信息进行检索,这需要人工先对这些信息进行描述和分类,随着数据库容量的不断增大,人工输入标注属性的方法不能满足人们对海量信息的需求,且人工对音乐的描述属性高度主观,难以表达蕴藏在音乐数据中丰富的内容以及内容感知描述的直观性。此外,随着数据容量的增加,用户很难记住所有数据的描述信息。因此,希望找到一种更加方便、快速的检索方法。
基于内容的检索方式不依靠标注信息,它从新的角度来管理音乐信息。根据音乐中的旋律、音高、节奏等信息进行检索。哼唱式音乐检索是基于内容的音乐检索方法之一,它允许用户通过哼唱的方式来查找所需的歌曲。本文以此展开研究工作,要实现基于内容的哼唱式音乐检索系统必须对三个方面的内容进行研究。首要问题是如何从哼唱信号中有效的提取旋律特征信息。由于哼唱音符的准确切分,即音高提取和音长切分的准确与否直接影响查找效果,因此这是哼唱音乐检索系统的关键问题之一,本文中采用了基于凸出度的音符切分方法;其次,如何从复合音、多音轨乐曲中提取主旋律特征信息,我们采用了当前大部分哼唱检索系统广泛使用的单音轨的MIDI数据库;最后,就是如何提高检索的速度,本文中通过对线性伸缩、动态时间规整及字符串相似匹配算法的性能比较,在试验部分观察了它们在检索上的识别效果,讨论他们的优点和缺点。我们对线性伸缩算法进行一定的改进,提出了分段线性伸缩算法,很好的解决了哼唱不一致的情况;我们还讨论了基于歌唱片段的不定长分割方法用于哼唱片段的模糊匹配。