基于哼唱的音乐检索系统研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:cecil666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在物质资源日益丰富的今天,娱乐活动越来越受到人们的追捧,而音乐是娱乐活动中最不可或缺的一项。通过音乐,人们可以在情感上获得一些共鸣,交到知心朋友,可以发泄或是分享情绪,可以分享快乐分担悲伤。计算机网络技术和多媒体技术都在迅猛发展,互联网上的音频资源随之日益增长。如何快速便捷地搜寻到自己喜欢的音乐用于欣赏使得基于内容的音乐检索成为众多专家学者和研究机构研究的热点,也取得很多突破性成绩和发展。   哼唱式音乐检索只需要用户哼唱歌曲中一段旋律即可在较大规模的乐曲数据库中查询到想要的歌曲。这种搜歌方式简单快捷,减轻了用户的记忆负担,摆脱传统基于文本音频检索的束缚,极大地增强用户体验度,是一种颠覆性的音乐搜索方式。这种方式非常符合现代人娱乐享受的价值观,具有很高的研究价值。   本文对哼唱检索系统中的关键技术进行研究,大致分为哼唱音乐的旋律特征提取、数据库音乐旋律特征提取和旋律近似度匹配3方面,并在此基础上设计实现了一个哼唱检索系统。本文研究内容主要包括:   1.分析不同音乐存储格式的优缺点,选取WAV音乐作为数据库音乐的存储格式。分析哼唱音乐的旋律特征表示方式,选取音高差、音长比作为哼唱检索系统的旋律特征参数。   2.研究了哼唱音乐的旋律特征提取方法。对于用户哼唱输入的片段进行合适的处理,提取出哼唱音符的音高差、音长比特征参数。   3.介绍了在哼唱检索系统中应用广泛的DTW算法和LAM算法。针对DTW算法中忽略节奏信息的缺点,利用音符的音高差、音长比特征参数共同构成算法中的代价函数改进DTW算法。将改进算法与DTW算法进行测试对比,显示改进DTW算法的检索成功率更高。   4.设计实现了功能完善的哼唱式搜歌系统,通过测试对音乐检索效果进行分析和评价,为以后的改进和发展提供很好的参照。实验分析表明,加入音长信息的改进DTW算法匹配成功率更高,有效提升了哼唱检索系统系能。
其他文献
SAR(合成孔径雷达)凭借其探测距离远、受气候和光线影响小等诸多优点,在国防军事上和人民生活中发挥着重要作用[1]。SAR成像需要处理的数据规模庞大,运算量大,难以实现高帧率
在人与人的交流中,信息并不完全来自于语言,还有一些从人脸得到的视觉上的信息也是非常重要的,如交流对方的性别,年龄,情感等等。所以近年来越来越多的研究人员开始研究这方面的课
建筑物透视雷达多目标跟踪系统可以最大限度地感知探测区域如目标个数、实时位置等相关信息,为灾难救援、刑事执法抓捕、反恐监视侦察等方面的决策人员制定后续相应决策提供
目前,WCDMA已成为当前世界上采用的国家及地区最广泛的,终端种类最丰富的一种3G标准。本课题就是对WCDMA侦收机进行设计和实现。WCDMA侦收机的功能包括获取小区广播信息和用
足球比赛持续时间长,视频数据量庞大,由于观众感兴趣的精彩事件占据比赛视频的比例较小,足球视频精彩事件自动检测便成为视频语义分析领域研究的热点和难点。目前常用的事件检测
随着互联网的普及和移动通信的发展,尤其是现在高速移动网络的形成,人们对于视频通信业务的需求越来越大,如视频会议、视频监控、视频电话等。它改变了传统的通信模式,带给我
麦克风阵列声源定位是利用麦克风组成的阵列来估计声源位置的技术,在日常生产与生活中有着广泛的应用。声源定位算法一般分为基于高分辨率谱估计,基于时延差估计和基于可控波束
为了满足人类日益增长的通信需求,现代通信系统不断走向高速化,宽带化,但是频带利用率却仍然不高。然而频率是宝贵的资源,故研究高效调制技术,提高频谱利用率,具有重要的实际意义和
认知无线电技术是无线电技术发展的一个里程碑,它的出现给无线通信带来了革命性的变化。认知无线电是一种智能的频谱共享技术,从用户通过频谱感知伺机占用主用户遗留的空闲频
自组织网络(Self-optimizing network SON)是LTE-A系统的关键技术之一。SON可以降低人工干预,减少运营费用并提高网络性能,其流程主要包括测量、自配置、自优化和自修复。本文主