基于多模态的音乐情感分类方法的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:dindin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐情感分类在音乐检索和音乐推荐等方面具有广泛的应用。国内主流的搜索引擎百度(Baidu)和门户网站网易(163)都相继推出了音乐情感检索系统,但检索的准确率都不高。以往的音乐情感分类技术仪仪专注于音乐的歌词或音频内容等某种单模态属性。而事实上,音乐是一个非常复杂的情感载体,音乐的歌词文本信息、音频信息,甚至音乐的Midi信息都不同程度的表达着一首音乐的情感。  本文的目的就是试图探索将音乐的三利,模态信息结合起来用于对音乐进行情感分类和回归。首先对三个模态的特征向量进行特征降维,使用简单的向量拼接的方法对音乐进行情感分类;然后使用集成机器学习算法包括Bagging、AdaBoost等对三个模态进行集成学习,产生一个强分类器:最后将AdaBoost算法与分层的方法结合起来,从而使音乐情感识别的准确率得到了有效的提高。  本文取得的研究成果列举如下:  1.分别基于音乐的歌词信息、音频信息、Midi信息三个单模态进行音乐情感分类,并分别对三者进行特征降维。  2.使用了集成学习中经典的Bagging、AdaBoost算法以及基于BP神经网络的NCL(负相关机器学习)算法,分别针对歌词、音频、Midi符号信息各训练一个弱分类器,然后将各个弱分类器集成到一个强分类器。  3.将AdaBoost与分层的方法结合,首先使用AdaBoost算法集成三个单模态的信息分别对P、A两个情感维度进行2分类,然后结合分层的方法对音乐情感进行4分类。
其他文献
随着人口信息系统应用范围的不断扩大,数据将急剧增长,简单的设施的扩容虽然能在一定时期满足人口信息系统的需求但不是长久之计。云计算的便利、经济、高可扩展性等优势吸引
Sybil账号是由恶意攻击者创建的,用来不公平的获取大量互联网资源与能力的虚假账号。长久以来,人们注意到sybil账号出现在各种互联网社区中,例如文件共享系统。但由于缺乏进
网页作为人类知识的一个重要载体,像照片一样记录了人类的历史,是人类的一份珍贵史料。同时,网页如同书籍、报纸一样,其生存周期是有限的。因此,就有许多有机构致力于有效的
非功能需求建模在软件工程领域越来越受到重视,存在着多种分析和建模方法,其中NFR Framework是一种发展迅速和应用广泛的框架。该框架的思想是用软目标来表示非功能需求,将顶层
手指静脉识别技术是近十年来新兴的生物特征识别技术。她具有防伪性好、识别率高等优点,因而具有广阔的市场前景。六年来作者所在的研究小组自主研发了手指静脉的采集设备,并
随着近年来智能移动设备的快速普及和移动互联网的高速发展,电子文档被越来越多的使用和传播。而在电子文档中,需要使用一种良好的数据格式来用于保存和传输数据。XML由于良
近十年以来,互联网的发展速度超乎人们的想象,网络中的内容不断呈爆炸趋势增长。如今人们使用互联网时更在意网络中的内容,但是网络的通信模型却是基于位置的,仍然沿用上个世
内容中心网络(Content-centric networking,CCN)是由美国帕罗阿图研究中心提出并致力于发展的下一代基于内容的互联网的基础协议及底层架构。随着近十几年来互联网上用户和内
众所周知,地理问题分析与求解是一个非常复杂的过程。而将分析出的地理模型实现成可运行的程序更是一项庞大的工程,需要消耗很多的人力和财力。当前现状是,大量实用地理模型己被
失语症形成的原因有多种多样,脑卒中等神经疾病是导致言语缺失最常见的原因。由脑卒中引起失语症可以通过言语康复训练进行恢复,从而提高他们的交流能力,让他们更好的融入生活。