基于音色特征的音乐风格分类研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:whfbbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来音乐信息检索领域迅猛发展,检索方式也日趋多样化,比如按相似度,按情绪检索等,而按音乐风格检索仍是人们最为熟悉的检索方式之一。本文重点研究了与音乐风格分类相关的特征表示问题,并实现了一个音乐风格自动分类系统。   首先,不同音乐风格之间的差异主要体现在使用的乐器组合上,而乐器的差异造成了感知的音色不同。从信号处理的观点来看,音色的差异主要体现在频谱轮廓与谐波结构两个方面。针对以上两方面,分别提取Mel倒谱系数,频谱平整度和对比度短时特征,利用上述短时特征分类准确率为72.2%。   其次,音色的差异还体现在频谱轮廓和谐波结构的变化之中。对上述提取的短时特征进行调制谱分析,以获得这些特征的长时变化信息。改进了传统的调制谱分析所采用的线性分带方式,采用小波分带方式,分类准确率从75.3%提高到80.5%。   最后,将上述短时与长时特征相结合,比较了结合后的每帧特征在特征上融合和在结果上融合两种融合策略,前者准确率为83%,后者为86.4%,同时利用特征空间映射最大惯性商的方法进行了特征选择,使特征维数降低了40%,而分类结果仅降低0.2%,并且比较了选取不同长度的音乐片段对分类结果的影响,对于5s的音乐片段,分类结果在81%以上。   综上所述,本文提取了关于音乐风格的特征表示,对不同音乐风格就有良好的区分性,并且适用于不同长度的音乐片段。
其他文献
随着网络的发展,开发Web应用系统,特别是开发企业级Web应用系统已经成为软件开发的一个重要领域。开发企业级Web应用系统通常要求有一个良好的软件体系结构、更多的技术手段、
学位
本文通过对荣华二采区10
期刊
多输入多输出(MIMO)技术能够提供很好的空间分集和系统容量,显著提高系统性能。MIMO技术要求终端具备多根天线,但是,现代移动终端的小型化导致移动终端尺寸受限,因此多天线移
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
产肠毒素性大肠杆菌(Enterotoxigenic Escherichia coli.,ETEC)是一类引起人和幼畜(初生仔猪、犊牛、羔羊)腹泻的重要病原菌,初生幼畜被ETEC感染后,常因剧烈水样腹泻和迅速脱水而
随着互联网络覆盖区域和客户人群的扩大,业务需求的不断推陈出新,以及网络业务复杂性的大幅度增加,提高网络交换设备的应用性能和数据处理能力的需求日益迫切。Crossbar交换
人脸识别的难点在于光照,姿态以及表情等变化给识别带来的不确定性,由于这些不确定性,之前人脸识别作为一个经典课题虽然经历了数十年研究,却仍然没有出现有效的解决方法。然
近年来,仿人机器人作为一种新型的智能机器人逐渐成为机器人研究领域中的一个热点。与传统机器人相比,仿人机器人具有避障能力强,能耗低,外形人性化等特点。它设计的出发点和和运
MIL-STD-1553B总线,是美国军方专门为机载设备制定的一种信息传输总线标准。目前随着计算机技术的发展,航空航天电子综合化也在飞速地发展。这种综合化的电子系统一般不是单
磁共振成像技术已经成为现代医学临床诊断的重要手段,具有无损伤的特点。射频接收线圈作为接收链的最前端,对成像质量起着举足轻重的作用,直接影响图像信噪比。多通道相控阵