哼唱搜索技术的研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:wuliaoaiaia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
哼唱搜索(Query by Humming)是一种基于内容的音乐搜索技术,它是涉及信号处理和模式识别等领域的综合研究课题。与传统的基于文本的搜索不同,哼唱搜索为人们提供了一种很自然的搜索方式,即以哼唱语音信号作为搜索输入。哼唱搜索在搜索引擎和数字图书馆中都将会有广阔的应用前景。   在哼唱搜索系统中,用户可以通过哼唱一段旋律,来搜索到自己期望的歌曲。搜索过程如下:首先通过语音输入设备哼唱一个歌曲的旋律,从这段旋律中抽取出特征;然后使用该特征在已有音乐数据特征库中进行检索;最后按照相似度的大小,返回一个可能的歌曲列表。   本文用{U,D,S}字母表构成的字符串来描述每首歌曲,每个字母表示相邻音符(note)的音高(pitch)的相对关系。这些UDS字符串被称为音高轮廓,也是哼唱搜索系统的特征。本文结合自相关(autocorrelation)分析和倒谱(cepstrum)分析,对清唱数据库中的歌曲进行了音高追踪。再对每首歌曲进行按句分割,每个句子用音高轮廓表示。之后对句子集应用了K-means聚类,利用类标签对每首歌曲进行编码。哼唱输入信号可以用相同的处理方法得到编码串。最后利用字符串模糊匹配算法,将哼唱输入信号和数据库中歌曲的编码串进行模糊匹配,得到前10位歌曲列表。   实验结果表明,与传统方法相比本文的方法在搜索命中率上的表现不是很好,但是大大降低了平均搜索时间。  
其他文献
模糊粗糙集是将粗糙集和模糊集结合起来处理不精确和不确定信息的数学理论。目前关于模糊粗糙集的研究主要集中在模糊粗糙集的定义上,而对于模糊粗糙集约简的研究还比较少。
普适计算的核心是嵌入式系统,在普适计算的环境下,各种嵌入式系统应用正面临着海量数据处理的挑战,特别是在工业现场数据采集系统中,这种挑战主要是如何保证数据处理的高效性、安
随着社会信息化建设的发展,企业和政府部门的大量数据转移到数据库系统之中,数据库安全成为了人们普遍关注的问题。权限管理是数据库安全的基础,只有将数据库中的权限进行合
随着网络的大量普及,存储技术、多媒体技术、数据库技术快速发展,人们对图像的应用要求也日益增长,图像中包含大量的语义信息,图像语义标注是所有图像语义研究的基础。目前,
随着信息技术的快速发展,信息数据量的增长越来越快。磁盘作为数据存储的容器,其容量越来越大,可是CPU和I/O之间的性能差距不断扩大。磁盘数据传输技术的发展速度远远落后于CPU
随着数码设备的普及和Adobe Photoshop,ACD-See等具有强大功能的图像处理软件的广泛应用,将数字图像进行变换、更改变得愈发容易,而对于通过不正当的手段篡改过的图像也愈发难以
随着互联网的发展和普及,垃圾邮件问题日益严重。垃圾邮件的广泛传播不仅加重了网络传输的负担,而且还给用户带来很多不便和危害。研究反垃圾邮件技术,有效地过滤和防范垃圾邮件
随着统计技术的发展,大规模的双语语料库是机器翻译和跨语言处理中不可缺少的基本资源。平行双语语料库提供了两种相应语言的丰富的匹配信息。通常情况下,获得高质量和大规模
计算场景中数量庞大的各种对象间的距离以判断交互与否是游戏系统中兴趣管理功能的一类主要计算工作。Kd-tree作为一种最近邻查找工具已被应用于游戏空间的分割,在一定程度上
我国大多数注水开发油田采出程度及综合含水指数均已很高。油井大规模采用机械采油方式使得井内流体压力低于饱和压力,产生原油脱气现象,造成油井内油气水三相流动状态。在油田