基于多重分形的语音情感识别研究

来源 :长沙理工大学 | 被引量 : 9次 | 上传用户:apple90317
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的快速发展,新型的人机交互(Human Machine Interaction, HMI)技术逐渐成为当前计算机科学领域的研究热点。语音情感识别的研究对于增强计算机的人性化和智能化,建立新型人机交互环境等具有重要的现实意义,并将产生很好的经济和社会效益。本文首先简述了课题的研究背景及文中的主要研究内容,回顾并分析了现阶段国内外语音情感识别中涉及的几个关键技术,包括情感的分类、情感语料库的建立、语音情感特征提取以及情感分类算法等。在此基础上,采用多重分形理论分析语音信号在高兴、生气、悲伤和平静4种不同情感状态下的混沌特性,进而提取了多重分形谱特征和广义Hurst指数作为新的情感特征参数参加语音情感识别。具体内容如下:(1)基于柏林实验室的德语语料库EMO-DB,观察并分析了在高兴、生气、悲伤和平静四种情感状态下,语音信号的基频、能量振幅、过零率、共振峰以及Mel倒谱系数MFCC等特征的变化规律。(2)提出了基于多重分形的语音情感特征参数的提取方法。介于传统情感语音特征缺乏对语音混沌特性的表征,采用多重分形理论通过分析不同语音情感状态下的多重分形特征,提取多重分形谱参数和广义Hurst指数作为新的语音情感特征参数。多重分形特征的引入,弥补了传统线性特征在刻画不同情感类型特征上的不足。(3)根据多重分形对将强度较高的情感(高兴和生气)与强度较低的情感(悲伤和平静)有良好区分度的特性,通过建立SVM二叉树的中间节点,实现对情感类别间的粗分类,保证了将容易混淆的情感类别划归为一组,以便深入分析不同情感状态之间的细微差别。进而采用贡献最大的特征矢量对中间节点上的每组情感再进行分类,其贡献值的确定由经验而得。最后,实现了较为理想的基于经验性特征的SVM二叉树语音情感识别。
其他文献
网格能够整合网络中的异构资源,在动态的、多管理机制的虚拟组织中协调资源共享,解决大规模计算的资源共享问题。资源调度问题是网格系统最核心的部分,良好的资源调度策略可
基于视频图像的三维重建是计算机视觉、图形图像、虚拟现实等领域的重要研究内容,其目标是利用一幅或多幅二维视频图像恢复三维场景信息。可视外壳建模方法能够利用目标物体
在现代信息社会里,消息中间件在企事业单位信息系统之间的数据交换中起着非常重要的作用。消息中间件是一种利用高可靠的消息传递机制为分布式系统提供数据交换的软件,它有效
随着计算机技术的不断发展,企业信息化程度不断深入,软件的需求量以及复杂度都在日益增加,传统的软件开发方法由于开发周期较长、成本较高而且开发的软件质量较差等不足,已无
随着地面、车载、机载激光扫描采集系统技术的成熟,国内外越来越多的研究人员开始研究基于激光点云的物体三维建模。点云特征提取作为基于激光点云三维建模的一个重要环节,也
随着移动自组网的发展以及多媒体业务需求的增加,提供QoS(Quality of Service,服务质量)保证已经逐渐成为移动自组网研究的一个重要课题。目前,移动自组网QoS保证还存在着不
本体作为表达知识的共享概念模型,自提出以来就引起了国内外许多学者的关注,并日渐成为知识工程、知识管理、信息检索、语义Web和人工智能中的一种重要的建模工具。本研究针对
随着计算机科学的发展,传统的办公模式已经越来越显示了其低效性和资源的巨大浪费,办公自动化可以帮助实现各部门、各企业之间的协作,便捷的进行信息的收集与处理,流动与共享
随着社会信息化程度不断提高,人们对网络地依赖日益增强,计算机网络安全问题得到人们的广泛关注。入侵检测技术作为一种重要的安全防护技术,很好地解决了访问控制、身份认证
随着全球化的快速发展,社会的竞争也越来越大,人们需要不断地扩充自己的知识,提高自己的技能来适应这个日新月异的世界,因此,在这样一个学习型的社会背景下,远程学习平台的发