基于内容的哼唱式音乐检索研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:haruhana
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字音乐技术的迅猛发展和手机等移动设备存储容量的增加,如何快速、有效地检索音乐信息成为迫切需要解决的问题。传统基于文本的检索方法,只能对有标注的数据信息进行检索,这需要人工先对这些信息进行描述和分类,随着数据库容量的不断增大,人工输入标注属性的方法不能满足人们对海量信息的需求,且人工对音乐的描述属性高度主观,难以表达蕴藏在音乐数据中丰富的内容以及内容感知描述的直观性。此外,随着数据容量的增加,用户很难记住所有数据的描述信息。因此,希望找到一种更加方便、快速的检索方法。基于内容的检索方式不依靠标注信息,它从新的角度来管理音乐信息。根据音乐中的旋律、音高、节奏等信息进行检索。哼唱式音乐检索是基于内容的音乐检索方法之一,它允许用户通过哼唱的方式来查找所需的歌曲。本文以此展开研究工作,要实现基于内容的哼唱式音乐检索系统必须对三方面的内容进行研究:人哼唱的音频数据特征提取、数据库中旋律特征的提取和表达、旋律特征的匹配检索。基于内容的音乐检索研究主要有两类,一类是针对基于乐谱的符号数据存储格式(MIDI)的音乐数据,另一类是针对用声学信号表示的音频数据存储格式(Wav、MP3)的音乐数据。前者已有较充分的研究,而迄今为止对后者的研究尚不多。本文对这两种类型数据库的哼唱检索方法展开研究,改进了现有面向MIDI数据库检索方法,使其具有较好的噪声鲁棒性,提高其检索的速度。对于Wav/MP3数据库,本文提出了一套基准检索系统。系统设计过程中采用了计算听觉场景分析,音乐节奏检测,基于GMM的歌声段检测、基于HMM的音高跟踪机制等技术。我们通过详细的实验证明了系统的有效性和可行性,并给出了详尽的比较结果。
其他文献
随着计算机网络技术的飞速发展,数字多媒体的存储、复制与传播变得非常方便,如何在网络环境下实施有效的版权保护,已引起国际学术界、企业界和政府的高度关注。本文在比较全
随着网络延伸到生活中的各个角落,有眼光的学者和企业都发现了网络中的节点所蕴藏的巨大计算潜力,于是基于广域网的分布式应用逐渐成为研究热点,P2P软件的兴起有力的证明了这
本文的目标是设计和研究一个快速开发平台,可以使开发人员以此为基础进行J2EE项目软件的开发。平台实现了MVC设计模式,解决了开发缓慢、难以维护、难以积累等问题,尽力做到大
商品销售是一个高度复杂的非线性动态系统,其变化规律即有一定的自身的趋势性,又受政治的、经济的、心理的诸多因素的影响。建立在数理统计基础上的传统定量预测方法在对销售
传统的人机交互过程一般通过鼠标、键盘等方式进行,这种只基于逻辑的方式无法使机器理解和适应人的情感。为计算机加入情感识别功能,可使其像人一样去理解各种情感特征并作出
在按需定制计算问题背景下,本文首先介绍了3种国内外主流的方面化中间件平台的内核结构及AOP实现方式,并从框架扩展性、依赖关系可管理性和AOP支持粒度的角度分析了其优缺点,
在科学技术高速发展的今天,计算机和Internet已经成为了人们生活中必不可少的要素。越来越多的产品以数字化的形式展现在人们面前,但随之而来的是日益严峻的版权纠纷问题。采
羽毛球运动是我国的重点夺金项目,在世界排名中居领先地位,占据着非常有力的位置。随着新规则的实施和竞争对手实力的增强,对我国羽毛球运动员提出了更高的要求,不仅要具备过硬的
图像压缩技术是多媒体技术研究的重点问题,其中嵌入式零树小波压缩算法又被认为是迄今为止最有效的压缩算法,但因为压缩过程是一个耗时的过程,所以为了更好地扩展嵌入式零树
由于量子计算有可能从根本上超越经典计算机的计算能力以及在信息处理方面的巨大潜力,量子计算机吸引了越来越多的人对其进行研究。量子电路作为量子计算机的一个基本计算模型