音乐情感参数化系统的研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:Hmilts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今互联网浪潮的推动下,数字音乐的数量出现了爆炸式的增长,急需高效的分类管理方法。近年来,国内外学者针对音乐检索展开了广泛、深入的研究,但是未能取得广泛的应用,一方面,音乐检索是一个多学科交叉领域,研究难度大;另一方面,目前的众多研究多以音乐流派和情感标签作为分类目标,类似传统的分类管理方式,存在局限性。因此,开展音乐检索相关研究具有重要的研究价值。针对目前基于情感的音乐检索研究的不足,本文提出以参数来表示音乐情感强弱的方法,首先提取音乐情感特征,组成特征向量,然后利用fisher算法进行维数压缩,再通过大量的音乐样本对音乐情感参数化系统进行训练,最终得到节奏、音调和音色三个描述音乐情感强弱的参数。本文的研究成果主要有以下几个方面:首先,音乐情感特征的研究,通过实验证明MFCC是一组非常重要的参数,它在很大程度上决定了音乐情感分类的正确率。对于MFCC特征维数的选取,实验结果表明,13、14维是比较合理的。不同特征之前没有相互排斥,而是相互补充,因此搭配使用不同的特征有助于提高总体的分类正确率。其次,Fisher和SVM两种不同算法分类性能比较,在音乐情感类别很少的情况下,比如2个类别,两者分类性能接近,为了方便分类器设计、节省计算资源,优先选择Fisher分类器;在类别很多的时候,为了保证分类正确率,应该选择SVM这一类基于机器学习理论分类器;当类别特别多,起到关键作用的是音乐情感特征的选取,而不是分类器算法,应该将研究重点放在这方面。最后,音乐情感参数化系统的设计,本文以Marsyas音频处理库为基础,搭建了基于数据流模型的系统框架,选择了适当的情感特征组成特征向量,同时选择Fisher算法作为分类器,使用大量的音乐样本进行了系统训练,并对节奏、音调和音色三个参数进行参数归一化处理,最终完成了音乐情感参数化系统的实现。测试实验结果表明,本文实现的系统能够达到88%的识别正确率,基本满足实际应用需求,可以为相关的音乐管理软件提供搜索引擎,促进音乐自动搜索技术的发展。
其他文献
为了满足国民经济发展的需要,当前我国电力工业正处于快速发展的新阶段,在电力建设大好的形势下,各式变电站和输电线路的施工显得尤为重要。电力基建工程的成本控制是所有输
在世界全球化进程不断深入的过程中,国家间的联系愈来愈紧密,国家间的安全合作作为各国维护国家安全、谋求安全利益的有效途径,受到了广泛的重视。20世纪90年代以来,以共同安
微博,也就是微型博客,作为一种新兴的网络信息媒介,正日益成为网络用户信息交流的平台,群众实现政治参与、社会监督的手段,政府部门、企业单位传达宣贯、政策和消息的工具。
<正>纵观近几年高考考题,笔者认为题目考查的重点大都落在典型的"模型"问题上,其中"碰撞"模型一直是近几年高考的热点。弹性碰撞问
用固相萃取-高效液相色谱法对烟草中吡虫啉(imidacloprid)、多菌灵(carbendazim)、甲基硫菌灵(thiophanate-methyl)3种农药同时进行残留分析。用丙酮/水(1:1,V/V)提取,二氯甲
近年来,以“震网”、“火焰”病毒为代表的,有组织、有目的的针对工业控制系统的安全攻击时有发生,工业控制系统的安全威胁日益严重。工业控制系统的专业性,以及系统运行高可
手机因其时尚、潮流、方便快捷而倍受消费者青睐。在生活富裕的城市,人手拥有一部手机甚至同时拥有几部都是十分常见的事。近年来,农村经济发展迅速,2000年农村居民人均纯收入为
本文从尾翼的物理学原理入手,分析了汽车尾翼的基本原理以及当今汽车尾翼的种类及其意义。
静脉输液是最常用的一种医疗手段之一,传统的输液滴速调节需要通过人手操作塑料夹持器收紧或放松输液管来实现。然而,由于输液滴速往往受到诸多因素的影响,在一些需要严格控制输