基于内容的多音音乐检索系统设计

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:chinaprogram
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何从口益增长的多媒体资源中快速准确地定位已成为多媒体检索领域的研究热点,其相关技术的研究必将推动人机交互技术的发展,但目前基于内容的音频检索相对于基于内容的图像或视频检索来说发展滞后。哼唱检索是基于内容的音频检索的一个重要分支,是一种最自然、最方便的音乐检索方式,用户只需哼唱出一段旋律,就能在音乐数据库中检索出想要的歌曲。当前音乐检索支持的音乐格式主要是MIDI格式,而对MP3、WAV等格式的多音音乐检索的研究成果很不理想。本文在分析研究多音音乐检索的关键技术和难点问题的基础上,完成了哼唱输入的端点检测和目标音乐的音乐分割,改进并完善了基于基频矩阵的基音提取算法,归纳了用于音乐检索的DTW算法,实现了多音音乐的特征提取和特征匹配,最后设计实现了本文的多音音乐检索Music-Retrieval系统。本文主要研究的内容如下:(1)在分析音乐检索的原理和音乐乐理知识的基础上,选取了广泛用于音乐检索的旋律(音高、基音)特征来表征音乐;设计了基于内容的多音音乐检索的总体框架,分析了多音音乐检索的难点及本文研究实现的重点。(2)讨论了音乐信号的预处理,选用了基于频谱能量的端点检测算法实现了哼唱输入的端点检测,完成了对目标音乐的多音音乐分割,减少了后期特征提取和特征匹配的工作量。(3)仿真分析了基本的基于时域、频域的基音提取算法从含有复杂背景伴奏的目标多音音乐中提取基音特征的缺陷,在探讨现有的基于基频矩阵的基音提取算法的基础上,改进并完善了该算法,实现了在不能构造基频矩阵的情况下依然能够从目标音乐中提取到音乐的基音特征,并降低了计算的复杂度;(4)分析讨论了在语音识别领域中广泛使用的DTW算法用于多音音乐特征匹配的优缺点,归纳了适用于音乐检索的DTW算法,较好的克服了哼唱输入的音调误差,减少了匹配时间,实现了哼唱输入与目标音乐的特征匹配。(5)完成了本文Music-Retrieval系统的功能设计,采用VC++编程实现了该系统;采集了哼唱输入片段作为实验数据,完成了音乐检索系统的实验评测,包括算法的有效性实验,系统的检索性能、速度和精度等实验。
其他文献
在服务器技术领域有了翻天覆地变化的今天,随之而来的是经济生活中广泛应用服务器系统,同时针对服务器系统则提出了进一步的要求,即可靠性和稳定性。服务器系统的可用性成为主要
2015年我国专用汽车行业整体陷入低谷.来自中国汽车技术研究中心数据资源中心的数据显示,去年我国专用汽车市场销量低至71.5万辆(除自卸车、半挂车外的六大类专用车),同比下
无线传感器网络是由大量微型、低成本、低功率,具有感应、通信和处理信息能力的传感器节点组成的,其目的是感知网络覆盖区域内监测对象的信息并将信息通过多跳的方式发送给观
签名是被社会普遍接受的一种身份验证方法。由于其易模仿性,因此成为了伪造的对象。签名验证是通过分析手写人书写风格的一种判断书写人身份的方法。在日常生活中,签名验证发挥
背靠母公司 博山起航rn安科卫盾是全球知名石油装备生产商,总部位于英国,隶属于美国企业Gardner Denver集团.根据安科卫盾的总经理迈克尔奥尼尔(Michael O’Neil)介绍,安科卫
随着当代无线通信事业的迅猛发展,无线频谱资源已显得越来越匮乏,传统固定静态的无线频谱分配模式和策略,很难为未来的无线通信事业的进一步发展提供更多可利用的无线频谱带
3GPP提出的LTE得到世界各主流通信设备商和运营商的广泛关注,并逐步开始其测试和部分地区的规模商用。但随着未来通信需求的不断提高和ITUIMT-Advanced(4G)的提出,3GPP标准化
随着第三代移动通信系统的成功商用,人们对移动通信系统的性能提出了新的要求。为应对WiMAX等新兴技术的挑战,实现3G到4G的平稳过渡,TD-LTE技术开始进入人们视线,在未来几年,TD-LT
目前,无线通信系统大多部署在3GHz以下,随着接入网络的无线设备不断增多,移动数据业务量呈数量级增加。大量的无线数据对网络容量不断提升的需求导致在低频段出现频谱资源紧