基于哼唱的音乐检索技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在检索音乐时,往往会出现只记得音乐的部分旋律而忘记了乐曲的名称、曲作者等信息的情况。此时,难于采用传统的基于文本的音乐检索方法。通过哼唱旋律的方法实现音乐查询,不失为一种简单、方便、快捷的音乐查询方式。基于哼唱的音乐检索的本质是一种基于内容的音乐检索。基于哼唱的音乐检索技术的核心是音乐库中音乐和哼唱音乐的旋律提取以及旋律特征的近似匹配。音乐旋律特征包括音符的音高和音长等。针对音乐文件格式种类多,从不同的格式中提取旋律特征的准确度和难度不同的问题,选择了能精确记录音符信息的MIDI(Musical Instrument Data Interface)格式的音乐作为音乐库中的音乐。首先,通过计算比较MIDI音乐中各个通道的通道长度、重叠音符个数、平均音高和信息熵四个特征以确定音乐的主通道,进而提取出MIDI音乐主旋律。然后,对用户哼唱的音乐片段,根据语音信号短时能量的变化,使用自适应双阈值的方法从哼唱音乐中分割出音符。采用中心消波自相关函数的基音检测方法和最大权重法实现音符音高的提取。最后,采用基于动态规划的旋律特征近似匹配算法实现哼唱音乐与MIDI音乐旋律特征的比较,得出检索结果。试验结果比较了对MIDI音乐采用不同的主通道提取算法以及旋律特征不同的近似匹配算法对音乐检索结果的影响,开发了哼唱音乐检索原型系统,要求用户以“DA DA DA”方式进行哼唱,对于用户哼唱比较准的音乐片段,系统可以在存有360首音乐的音乐库中找到想要查找的音乐。
其他文献
随着科技文献的电子化,科研人员对文档图像的自动识别与理解的要求也越来越高。随着OCR技术的发展,基本实现了对文档图像中文字的识别理解。然而针对文档图像中数学公式的自动
随着计算机技术与internet互联网的发展,人们的信息交流带来了巨大的变化。各种现代化的技术手段和大量丰富的电子信息资源,提供和服务于人类社会。其中现代化的技术之一,计算机
椭圆曲线密码系统近年来已被广泛制定于各种国际标准,椭圆曲线密码技术可应用于加解密、数字签名、密钥交换、大数分解和质数判断等。在相同的安全强度下,ECC的密钥长度远比其
这几年,超声影像在前列腺外科临床中运用得越来越广泛。从超声图像中分割出前列腺的边界在测量前列腺体积,估测肿瘤边缘以及实时目标图像导引的活组织穿刺中有重要的临床意义
随着经济、社会和科技的发展,个人电脑、智能手机等设备大规模普及,互联网应用越来越广泛和深入,人们进入了大数据的时代。云计算、大数据、云存储共同组成了学术界和商业界
在Internet飞速发展的今天,随着新业务的增加和数据业务量的猛增,需要网络能够迅速有效地提供新的服务,实现网络与业务融合的需求也越来越迫切。在这种环境下,软交换技术应运
Ad Hoc网络作为一种“自组织”,“无中心”,无需固定网络基础设施支持的多跳无线网络,其特点决定了可以被广泛地应用于军事作战、传感器网络、某些紧急的临时性场合以及个人网络
多Agent系统技术已经在供应链管理等诸多领域逐渐体现了它的巨大潜力和价值。随着技术的发展,有关Agent模型结构研究主要集中于BDI或其演化模型。然而,在Agent工程化方面,尽管一
现在的开发环境多数是面向对象的,而存储机制往往是基于功能分解的关系型数据库,同时在DBMS(Database Management System)支持的数据库模型中,关系型数据库是最普遍的,因而就存在
随着联机手写识别技术的发展,多种语言的联机手写识别系统都已应用在各种嵌入式系统上。但泰文文字形状和结构特殊、相似文字多、手写体文字形变复杂,所以对泰文手写文字的识