基于哼唱的MP3音乐检索研究

来源 :河北农业大学 | 被引量 : 3次 | 上传用户:lyh555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字科技的发展,MP3凭借极高的压缩比与极小的失真,成为目前最受欢迎的数字音乐压缩格式,广泛在网络上流行。从大量的MP3音乐资料中检索出自己想要的歌曲,目前只能通过查询歌曲名或歌手名等信息进行检索。如果仅仅是知道一个曲调,就无法搜索到自己想要的歌曲。本文针对这种现况,主要对MP3音乐的哼唱检索进行了研究,使用户只要通过麦克风哼唱一首乐曲的旋律片段,就可以得到所要检索的MP3音乐。目前对哼唱检索系统的研究大部分都是对MIDI格式的检索,对MP3格式的处理研究的较少,另外对哼唱的要求多数是要求用特殊的哼唱方式,对于连续哼唱和带歌词哼唱研究较少。即使采用了连续哼唱的方式,也是提取出旋律轨迹信息后,使用用字符表示法表示,用字符匹配法进行匹配。在对哼唱信号的基频提取上,多数研究使用传统的方法对哼唱输入信号进行基频提取,在提取的过程中会出现种种的问题,对旋律轨迹的准确性造成一定程度的影响。由于连续哼唱方式下旋律轨迹数据量大,所以需要设计一个快速的旋律匹配算法进行旋律匹配计算。针对上面的问题,本文进行了如下的工作:在哼唱输入信号的特征提取模块中,对传统的基频提取算法进行了研究,发现了传统的基频提取算法中存在着各种各样的问题,针对要处理的带歌词哼唱和不带歌词哼唱两种哼唱输入信号,提出了一种小波变换结合自相关函数法对哼唱输入信号进行分析,提取基频轨迹的方法;在MP3旋律特征库的建立上,考虑到一首歌曲中最令人难忘的部分是人声演唱部分,所以首先对MP3音乐进行了预处理,将音乐中的人声信息提取出来,然后将人声部分的MP3音乐进行解码,在解码过程中提取基频;提出了一种精确音程表示法来表示旋律轮廓,使用音程表示法表示MP3旋律轮廓,并根据旋律轮廓建立MP3的旋律特征数据库;在旋律匹配检索模块中,提出了一种数值索引的方式,对旋律特征库中的音程信息建立索引,优化了动态时间规整(Dynamic Time Warping,DTW)算法;设计了一个基于哼唱的MP3音乐检索系统,针对各个模块进行实验模拟分析,证明了提出方法的有效性。
其他文献
融合传感器、嵌入式计算、分布式信息处理和无线通信等众多技术而形成的无线传感器网络是一种全新的信息获取、处理和传输技术,由于无线传感器网络具有组网快捷、灵活,且不受
随着信息技术的不断发展,互联网中海量的资源,在为网络的使用者提供各种各样的信息的同时,也由于其信息来源与构成的复杂与多样性,使得用户在获取信息的同时,也往往不得不忍
在当今的软件开发行业中,面向对象的开发模式获得了越来越广泛的应用。面向对象软件开发以其优秀的模块化,通过封装和接口达到模块的内部实现与外部接口分离的目的。对象行为
数据流上的突变检测在网络流量监测,金融风险分析,传感器网络等领域都有着十分广泛的应用。传统的突变检测算法只能对流上的聚集函数值进行检测,而在现实应用中,还有相当一部
与传统的C/S模式相比,移动代理技术有很多优点。但是移动代理的安全问题却使移动代理技术在走向商业应用的路上困难重重。究其原因是移动代理的安全问题缺乏合理的解决方案。
随着计算机技术的发展和工业生产及国民生活对智能测控仪器仪表的需求增加,虚拟仪器己经成为仪器仪表发展的重要方向。本文简要介绍了电表校验的意义和现状,指出了传统电表校验
嵌入式移动实时数据库管理系统是嵌入在各种设备,特别是移动设备的支持移动计算的数据库管理系统。数据字典是数据管理的一个重要组成部分,嵌入式移动实时数据库管理系统要求
目前市场上数字图象采集设备种类繁多,品牌各异,应用领域也不尽相同。商家在开发各自数字图像采集设备的时候,提供给用户用于二次开发的专用SDK(Software development kit)均
Web服务是一个松耦合的、平台独立的、自包含的、可调用的Web应用程序,是实现面向服务计算的关键技术。由于对异构环境的良好支持、开放性和跨平台等特点,使得Web服务在许多
由于计算机图形学和软硬件技术的快速发展,虚拟现实技术越来越为人们所重视。基于VRML的虚拟现实技术的应用一直是计算机应用领域的热点,虚拟现实技术的应用价值已经得到了广