哼唱式音乐检索与音乐风格分类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：yoyoyu2008

【摘要】

：

目前，搜索引擎以及在线音乐网站主要采用文本关键词匹配的方式搜索相关的音乐，其中用作文本关键词的信息可以是音乐名称、演唱者、专辑名称或者歌词等。然而，这种以文本关键词为

【作者】

：

杨小洪

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2011年期

【关键词】

：

哼唱式音乐检索性能音乐风格自动分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前，搜索引擎以及在线音乐网站主要采用文本关键词匹配的方式搜索相关的音乐，其中用作文本关键词的信息可以是音乐名称、演唱者、专辑名称或者歌词等。然而，这种以文本关键词为输入的检索方式存在一定的局限性。当用户不知道与被搜索音乐相关的文本信息或者文本信息输入不方便时，就无法通过这种方式进行音乐搜索。哼唱检索因其独特的输入方式正好可以弥补文本关键词检索的不足，从而逐渐成为音乐检索中的热门研究课题。本文主要对哼唱检索的若干关键问题包括音乐索引构建、哼唱查询旋律抽取、用户查询容错处理等方面进行研究，通过引入文本检索中的相关技术降低音乐库的存储空间以及系统索引和检索响应时间，提高检索性能。另外，音乐风格分类对提高音乐检索准确率有着重要的作用，本文对基于深度置信网络的音乐风格分类方法进行了研究。　　为了将音乐信息压缩存储，本文引入了文本检索中的倒排索引方法对音乐库中的MIDI音乐进行索引。由于大多数用户在哼唱音乐旋律时经常会出现跑调以及唱快或唱慢的现象，从而导致查询中存在额外插入音符、音符被遗漏和音符音高存在偏差的情况。为了更好的处理这些错误，本文提出了一种基于递归切分的检索方法，并运用具有容错的编辑距离方法计算旋律片段之间的相似度。实验结果显示基于倒排索引的递归切分检索方法具有较好的可行性，并且还有较大的改善和提升空间。　　通过对音乐作品曲式结构与文本文档语义结构的比较发现，音乐作品拥有与文本文档非常相似的结构特征。对音乐旋律重复模式的统计分析表明重复模式具有和文本文档词语类似的作用。因此，本文提出了一种基于词典的音乐检索方法。此方法将音乐看作是一种语言，把音乐旋律当作是文本文档，将音乐旋律中的重复模式作为音乐词语并以此构建音乐词典；然后使用前向或者后向最大匹配方法将音乐旋律进行切分成音乐词语并进行检索。实验表明基于词典的音乐检索方法能够有效地应用到哼唱检索中，与其他方法相比在索引运行时间和存储空间方面拥有比较明显的优势。　　为了支持快速检索以及对哼唱查询包含的音符插入、删除和替换错误具有容错性，本文提出了一种基于容错N-gram的音乐检索方法。此方法从哼唱查询的每一个音符抽取出四对音高和节奏N-gram，然后利用位置敏感哈希算法搜索近似的候选并用节奏信息进行过滤；在排序的过程中充分利用查询应该与候选歌曲中小范围内并且连续的旋律片段相匹配的特性，采用部分序列匹配的方法进行匹配并应用增加节奏信息的动态时间弯曲算法计算查询与候选歌曲之间的相似度。实验表明本文提出的基于容错N-gram的音乐检索方法在检索性能、索引构建和相似度计算方面具有较大的优势。　　在音乐风格分类方面，本文提出了基于深度置信网络的音乐风格自动分类方法。该方法首先以由音色纹理特征、频谱反差特征和调制频谱分析特征组成的特征向量为输入，以受限玻尔兹曼机为组块通过贪心逐层的方式构建和训练深度置信网络，然后使用基于梯度下降的有监督学习方法对整个置信网络的进行优化。通过分析网络层次结构、迭代训练次数对深度置信网络分类性能的影响，以及与其他分类方法诸如支持向量机、Κ近邻、线性判别分析和BP神经网络的比较，可以发现深度置信网络在音乐风格自动分类方面具有更好的性能。

其他文献

WSN中改进蚁群算法求解移动代理路由问题

无线传感器网络是资源受限型网络，传感器节点的能量、通信能力、计算和存储能力都是非常有限的。为了维持网络更长的工作时间，设计能量高效的路由协议成为无线传感器网络研究面

学位

无线传感器网络路由算法移动代理蚁群算法变异

基于单目视觉的摄像机轨迹分析算法的研究与实现

目前,计算机视觉系统正在广泛地应用于视觉检测、视觉导航和自动化装配领域中。在大多数视觉系统中,摄像机都是作为摄像工具,对摄像目标进行处理,但是摄像机是被动传感器,当

学位

无既定目标摄像机运动全局运动SIFT匹配

基于遗传和声算法的软件可靠性分配应用研究

本论文致力于软件可靠性优化分配技术的研究与实现的目的。全面分析了串联系统、并联系统、基于重要度复杂度、基于故障率分析、架构方式和基于AHP方式的多种软件系统可靠性

学位

可靠性分配遗传算法和声算法遗传和声算法优化模型

基于Mondrian的OLAP引擎的脚本计算设计开发与性能优化

随着数据库技术的广泛应用，企业信息系统产生了大量的数据，如何从这些海量数据中提取对企业决策分析有用的信息成为企业决策管理人员所面临的重要难题。数据仓库与OLAP（联机分析

学位

企业信息系统数据仓库联机分析处理OLAP计算引擎平台脚本计算

面向软件老化的Web应用系统分级再生策略研究

长时间运行的Web应用系统存在软件老化现象。软件老化会造成严重的经济损失、对系统可靠性影响大,如何解决Web应用系统软件老化问题已成为当前研究的热点。为了降低软件老化

学位

软件老化软件再生再生等级选择资源损耗量提取组件再生次序多属性决策BP网络

人脸表情识别及其在视频分类与推荐中的应用

近年来,随着智能接口和人机交互技术的迫切需求和快速发展,以人脸表情识别为主的情感计算成为新的研究热点。人脸表情识别能够增强人机交互的智能性和友好性,具有重要的科研

学位

人脸表情识别情感计算视频分类与推荐空间特征隐动态条件随机场

改进ACO算法在DTSP中的应用研究

蚁群优化算法( ACO )内在的并行性、鲁棒性等良好特性使其成为解决复杂组合优化问题的一种非常有效的计算模型,但ACO亦存在初始求解速度慢、易出现早熟或停滞现象的缺陷,本文

学位

蚁群优化免疫疫苗信息素动态更新Delaunay三角剖分分治算法

腹水癌细胞图像识别研究与应用—基于模糊识别的腹水癌细胞图像分类识别

如何快速地、准确地诊断癌症一直是困扰着医生的难题，很多肿瘤病例由于病变区域介于良性与恶性之间，一些欠缺经验的医生不能及时下诊断，使得病患耽误医治的最佳时机。癌症的发病

学位

腹水癌细胞图像识别模糊集合

基于用户查询日志的中文互联网问句自动生成和查询压缩研究

随着互联网用户和规模爆炸式增长,如何让用户更快捷的搜索到需要的信息成了学术界和搜索引擎公司共同关注的问题。搜索引擎上用户查询的形式是多种多样的,如何正确的分析查询

学位

用户查询日志查询分析问句自动生成查询压缩

基于参考文档模型的个性化Web检索研究

随着计算机和互联网的迅速普及,人类进入了信息时代,各种信息资源呈现出了爆炸式地增长。在大量的信息中帮助用户更加准确地找到他们想要的信息就成为了信息检索的重要任务。

学位

查询日志分析个性化查询推荐参考文档模型

哼唱式音乐检索与音乐风格分类方法研究

与本文相关的学术论文