基于音频和歌词的音乐情感分类研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:shibin19860211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐的爆炸式增长和巨大数量使得我们的时代成为真正的数字音乐时代,同时,如何有效地管理音乐也成为一个值得关注的问题。情感是音乐最本质的特征,也是人们的心理感受,如何使计算机能够自动识别出音乐中的情感信息,对促进人工智能领域的发展具有非常重大的意义。针对音乐情感分类的问题,为了弥补仅利用音频特征进行音乐情感分类的单一模态分类方法的不足,本文采用了结合音频和歌词的多模态音乐情感分类的方法。本文围绕音乐情感模型和分类模型的选取以及音乐特征的分析和处理展开,主要研究了如何利用歌词以及如何结合音频和歌词对音乐进行情感分类,并将多模态和单模态音乐情感分类性能进行了对比。在基于歌词的音乐情感分类中,在传统的CHI特征选择方法的基础上引入了频度、集中度和分散度三个参数对CHI统计值进行调节,提出了改进的CHI特征选择方法。特征选择之后,利用TFIDF方法计算权重,然后利用LSA对歌词进行二次降维。实验数据显示,在对歌词进行情感分类过程中,传统的CHI特征选择方法的准确率为58.20%,改进的CHI特征选择方法的准确率为67.21%,结合LSA和改进的CHI特征选择方法的准确率为69.68%。由此可见,第三种方法的准确率更高且维数更低。在基于音频和歌词的多模态音乐情感分类中,针对多模态融合问题,本文对传统的LFSM融合方法进行了改进,并通过实验对多种融合方法进行了比较,实验结果表明,改进的LFSM融合方法的分类效果最佳,达到84.43%,验证了该方法的可行性和有效性。
其他文献
MPPPM是多脉冲组合调制,是普通单脉冲PPM和BPSK的推广。它允许每个符号间隔有多个脉冲,它应用符号时隙帧中多个脉冲的位置和极性的不同组合传递信息,每个脉冲可以改变时隙位置和
学位
高光谱遥感或成像即在每个像素面积上获取大量窄波段连续光谱的物质辐射亮度。高光谱成像相对于传统的全色或彩色成像的主要优点是测量得到的反射率也就是物质的光谱特征可以
综合脉冲与孔径雷达(SIAR)是一种新体制米波雷达,具有良好的反隐身性能,可以通过把有限数量的阵元分布在一个有足够大半径的圆周上保证所需的角分辨率,而且能同时实现目标的
空间站局域网的交换体系结构对空间站局部网络的性能具有重要影响,一个好的网络交换体系结构可以保障系统正确工作,并且有效降低系统的硬件资源消耗和功耗,提高系统带宽和吞
HINOC (High performance Network Over Coax)技术利用有线电视网已有的同轴电缆线路和分配网络,组建最后100米范围内的宽带接入网,实现高速和高质量多业务接入。不仅可以向
随着数字技术在视频中普遍应用,视频可以通过数字摄像机反复拍摄,通过电脑软件轻松剪辑,通过光盘永久存储,通过网络快速传输,通过数字荧幕精彩呈现。数字化使更多更好的视频
对图像破损或丢失区域进行修复在数字图像处理领域是一个重要分支。同时也是信号处理,计算机视觉以及计算机图形学的热点问题。其主要任务在于让计算机自动按照人眼视觉特点,
进入21世纪以来,音频处理的相关技术一直稳健而又蓬勃地发展着。感知模型作为音频处理技术的重要组成部分,得到了广泛的应用。音频压缩编码技术、数字音频水印技术、音频编解
RFID技术,即射频识别技术,是自动识别技术的一种,兴起于20世纪90年代。RFID技术是通过无线射频方式进行非接触双向数据通信,对目标电子标签加以识别并获取相关数据。RFID技术具有
跳频通信在军事通信与民用移动通信中具有重要应用价值,跳频序列的性能是影响跳频通信系统的重要因素,跳频序列设计研究具有重要研究意义与应用价值。   本文在对跳频通信系
学位