基于旋律识别的音乐检索方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ChengpCN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今网络已经无处不在了。人们已经习惯于通过网络获取自己感兴趣的东西——包括音乐。传统的音乐检索方法通常是根据歌曲的名字或者歌手的名字来进行检索。本文则描述如何实现根据用户哼唱来检索乐曲。也就是基于内容的音乐检索。这种方法可以解决当只记得歌曲旋律而不知道歌曲名字时对歌曲进行检索的问题。  本文首先介绍了当前国内外相关领域的研究发展状况,并且分析了现有方法的局限性。接着阐述了与本论文相关的一些准备知识。然后详细阐述了本系统实现的一些算法。包括对哼唱语音片段的音符切分、对音乐库的处理以及歌曲之间相似度的计算方法。  在音符切分部分实现了Yin等人提出的一种基于自相关函数方法的改进算法。基本原理是清音和浊音的频率相差很大,可以通过频率的不同将清音浊音区分开来,切分后的浊音频率可以直接转换为音高,即完成了音符识别的功能。在音乐库处理部分提出了一种MIDI旋律音轨的提取算法和数据库索引建立方法,这也是该系统的关键部分。并且在清唱的系统上提出了一种分句的思想,这能够有效的减小哼唱和歌曲之间的长度差异对检索准确率的影响。在歌曲特征向量提取上,由于大多数人对歌曲的绝对音高演唱不准确,所以本文采用了相对音高的旋律轮廓表示方法,并且提出了采用27个特征向量元素表示一首歌曲的方法,而不是采用传统的9个特征向量元素。由于本系统采用了信息检索中的向量模型,所以在匹配算法部分,本文先后用了欧氏距离和向量间夹角的余弦值两种向量模型中通用的匹配算法。  在上述算法的基础上设计了一个音乐检索系统。通过对不同人的真实录音进行的实验,结果表明采用27个特征向量元素的表示方法的系统比采用传统的9个特征向量元素表示方法的系统在性能上有明显的提高。在文本的最后一章会有详细的实验方法说明和评测结果。  本文的研究与探索为进一步研究基于内容的音乐检索方法,开发高质量的音乐检索工具提供了良好的开端。
其他文献
自从有分布式概念以来,数据复制就成为理论研究和产业界的热门问题。从文件复制、内存复制等传统的分布式复制理论中,学者们已经提出了许多研究的成果,在数据一致性问题、负
医学图像可视化是一个多学科交叉的研究领域,它运用了数字图像处理、计算机图形学、虚拟现实技术以及医学领域相关知识,将处理后产生的数据转换为图形或图像,医学图像可视化包括
目的 探讨对糖尿病足患者使用臭氧气浴与解毒生肌膏进行临床治疗的效果.方法 收集整理本院历年诊治的糖尿病足患者的相关资料,并根据本次研究的目的及患者纳入标准,选择2017
XML是W3C于1998年推出的一种标记语言。由于其独特的技术优势,XML推出后很快就成为网络中数据表示及交换的标准。因此,要构建基于XML的各种应用,准确并高效的从XML数据源中查
随着网络技术多样性的增长以及网络应用的飞速发展对网络协议提出了更多更新的要求,这样原有的协议不足以支持新的应用需求和网络特征,必须扩展已有的协议或实现全新的协议。
Incidentally detected, sporadic, nonfunctional pancreatic neuroendocrine tumors are increasingly diagnosed on imaging studies performed for unrelated purposes.
今年是中国共产党成立85周年,是实施“十一五”规划的开局之年,也是全党开展保持共产党员先进性教育活动取得丰硕成果之年。在纪念建党85周年之际,为继承和发扬党的优良传统
从Internet出现以来,电子邮件就是Internet上最重要的服务之一。如今通过电子邮件进行信息交流,已经成为人们联系沟通的重要手段,而电子邮件的安全问题也越来越得到使用者的重视
Feedbacks given by teachers is possibly a common instruction in second language writing classes, to help students make progress in writing. At one time, feedbac
生鲜食品具有易变质、流通效率低等特点,冷链可以用于保持生鲜食品的新鲜度,其与普通物流的区别不仅在于食品对卫生环境的要求极高,更重要的是易腐食品对温度与时间控制有严格的