论文部分内容阅读
哼唱搜索(Query by Humming)是一种基于内容的音乐搜索技术,它是涉及信号处理和模式识别等领域的综合研究课题。与传统的基于文本的搜索不同,哼唱搜索为人们提供了一种很自然的搜索方式,即以哼唱语音信号作为搜索输入。哼唱搜索在搜索引擎和数字图书馆中都将会有广阔的应用前景。
在哼唱搜索系统中,用户可以通过哼唱一段旋律,来搜索到自己期望的歌曲。搜索过程如下:首先通过语音输入设备哼唱一个歌曲的旋律,从这段旋律中抽取出特征;然后使用该特征在已有音乐数据特征库中进行检索;最后按照相似度的大小,返回一个可能的歌曲列表。
本文用{U,D,S}字母表构成的字符串来描述每首歌曲,每个字母表示相邻音符(note)的音高(pitch)的相对关系。这些UDS字符串被称为音高轮廓,也是哼唱搜索系统的特征。本文结合自相关(autocorrelation)分析和倒谱(cepstrum)分析,对清唱数据库中的歌曲进行了音高追踪。再对每首歌曲进行按句分割,每个句子用音高轮廓表示。之后对句子集应用了K-means聚类,利用类标签对每首歌曲进行编码。哼唱输入信号可以用相同的处理方法得到编码串。最后利用字符串模糊匹配算法,将哼唱输入信号和数据库中歌曲的编码串进行模糊匹配,得到前10位歌曲列表。
实验结果表明,与传统方法相比本文的方法在搜索命中率上的表现不是很好,但是大大降低了平均搜索时间。