歌词情感识别技术研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:q372245556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歌曲情感识别是音乐信息检索领域中的重要问题之一,本文主要研究并实现了两种歌曲情感识别方法。与已有研究工作不同,本文利用歌词文本信息,分析得到歌曲的情感。   本文首先介绍了主要的情感模型,并依据歌曲的情感特点和音乐信息检索的需要,选择适合描述歌曲情感的模型。随后,按照歌曲情感分析所使用的信息源的类型,分类介绍了该领域已有的研究工作。对已有研究工作的应用场景和识别效果,给予适当评述。   为了提出适合歌词特点的情感分析方法,本文分析了歌词语料的特点,并与其它几种文本做比较。经过分析,发现歌词具有如下特点:篇幅短小,用词丰富,高频词汇少,情感表达细腻、隐晦。   根据歌词文本的特点,本文提出了两种歌词情感识别方法。   方法一利用情感词词典和模糊聚类方法,分析得到歌词的情感。首先,利用情感词词典抽取得到歌词中的情感单元。然后利用情感单元分析得到歌词中每个句子的情感。最后采用模糊聚类的方法,综合各个单句的情感得到整篇歌词的情感。本文构建了包含500篇歌词的样本数据集,并在该数据集上进行实验。与已有工作相比,本方法情感分析效果有显著改进。   方法二利用统计机器学习的方法,回归得到歌词的情感。考虑到歌词文本的特点,本文分别抽取歌词的词语特征和语义特征,并选用有效的特征选择方法,将一篇歌词表示成特征空间中的一个特征向量。利用支持向量回归机,得到歌词的情感。在方法一中构建的样本数据集上实验了本方法,实验效果较方法一有进一步的提升,情感回归相关系数达到0.7669。另外,构建了包含1250篇歌词的样本数据集,以测试该方法的泛化能力,相关系数最高达到0.7099,令人满意。实验证实虽然语义特征能较好地改善数据稀疏性问题,但利用词语特征识别歌词情感的效果优于利用语义特征的效果。
其他文献
纵观国内外大部分制糖企业除了煮糖阶段仍采用间歇法外,其余工序都已经基本实现了生产中的自动化控制。国内大部分制糖企业在煮糖工序结晶环节仍需人工目测感触晶粒的成长状
序列关联规则挖掘在许多领域有着广泛的应用,如客户行为分析,客户服务推荐等,但序列关联规则挖掘也存在一些挑战,当序列数据库规模较大时,内存和CPU资源就成为算法的瓶颈,即
本课题受国家自然科学基金项目(项目编号60970073)的资助,主要研究基于SOM神经网络的多维数据自动聚类算法及其应用。多维数据自动聚类作为优选动态流量软测量训练样本的主要
红外遥感利用物体的热辐射特性实现对目标的探测,被广泛应用于资源调查、环境监测、工农业生产及国防等各个领域。   红外成像系统的辐射定标是获取目标红外辐射特性的基
学位
零售信息化是加强油站经营管理的强有力手段。前庭设备控制系统是站级油品零售系统的核心,该系统负责前庭设备管理和控制、IFSF协议转换、油品数据管理、前庭信息配置等功能,
Ad Hoe网络,也被称为无线分组网络,是由若干带有无线收发装置的移动或固定节点所组成的多跳、没有中心节点的临时性自治网络系统。由于上述这些特性,它可以在许多特殊环境下(例如
过去十多年来越来越多的证据表明,静息态功能磁共振成像的研究数量处于稳步上升中。静息态与人脑内在的固有的自发活动有关,很可能反映人脑功能的基线状态。大脑的多个大规模
工作流技术是20世纪90年代发展起来的一项关于企业经营过程管理的技术,它的出现给企业带来了巨大的利益,例如:降低管理成本;提高企业工作效率:增强企业自我水平等。工作流技
密码技术是实现网络信息安全的核心,除了用于信息加密外,也用于数据信息签名与安全认证,是保护信息安全的最重要工具之一。随着计算机科学技术的发展,网络和信息技术已经渗透到社
学位
随着信息技术不断深入应用到金融、交通、军事、网络监测等领域,面向数据流的应用已经无处不在。而近年来互联网的广泛应用,海量的数据得以涌现。不同于传统的数据流只是一些