ITD在语音情感识别中的研究

来源 :长沙理工大学 | 被引量 : 1次 | 上传用户:l441060226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了使人和计算机能够更加人性化和自然化地交流,怎样让计算机具有情感识别的功能逐渐成为各领域研究的热点。其中,语音情感识别在情感识别中扮演着重要的角色,为了提高语音情感识别的准确率和效率,本文一方面进一步完善了表征语音情感的特征,另一方面在识别方法上使用了两种方法进行实验,具体研究过程有:(1)基于语音信号在短时内能保持线性和平稳的特性,对四种基本情感(愤怒、喜悦、平静、悲伤)提取的传统特征有短时能量、短时平均过零率、基音频率、短时平均幅度和前12阶MFCC系数,并对这些特征数据计算各自的统计特征,一共提取了92维传统特征。(2)语音从本质来说是多变的,整体呈现非线性,包含丰富的情感信息。为了更全面地描述情感语音信号,弥补只从短时线性提取特征,本文从语音信号的瞬时性和非线性(混沌机制)出发,首先通过对语音信号进行固有时间尺度分解(Intrinsic Time scale of Decomposition,ITD),获得前8阶合理旋转(PR)分量,再计算前3阶的PR分量的瞬时参数和第一阶PR分量的关联维数,以此作为其在瞬时特性以及混沌特性上新的情感特征。(3)在识别实验中,本文首先采用了传统的支持向量机(Support Vector Machine,SVM)对4组不同特征组合方案进行识别实验。通过比较各组实验的识别率,发现同时补充了PR瞬时特征和关联维数的这一组方案的识别率得到了有效的提高。但不足的是,对于相似情感仍然存在相互误判的情况。由于附加动量的后向传播神经网络(Back Propagation Neural Network,BPNN)在识别上具有计算速度快,可靠性强,稳定性好的特点,在识别实验中添加了用附加动量的BPNN算法对方案四重新进行了实验,实验数据显示,附加动量的BPNN算法相比支持向量机和BPNN,它的分类计算的性能更好,同时,该方法还能有效的减少相似情感相互误判的情况,有利于相似情感的识别。
其他文献
大规模的双语命名实体库可以有效的改进机器翻译、跨语言检索等系统的性能。因而前人提出了很多抓取双语命名实体的方法。早期的方法主要是从平行语料中进行抽取,这类方法存
随着传统应用系统集成技术弊端的不断暴露,企业迫切需要一套更经济、更有效的将各种应用系统集成起来的方法。本文主要针对传统技术的种种不足,利用Web Services的高松散藕合
图论是研究由线连接的点集的理论。图论是组合数学的一个重要分支,同时也是离散数学的一个重要组成部分。随着计算机科学与数学的发展,图论已经成为人们研究自然科学以及社会科
中文组织机构名的识别是中文信息处理中的一个重要任务,也是命名实体识别(Named Entity Recognition)研究的重点之一。命名实体包括人名、地名、机构名、时间短语等,组织机构
伴随网络和多媒体技术的快速发展,信息安全受到人们的普遍重视。图像加密是网络信息安全技术的重要分块之一,是保护图像多媒体信息的有效手段。针对图像数据的特点众多学者提出
随着企业信息化的普及,信息化系统的安全性也日益得到关注。访问控制作为保证系统安全性的一个重要机制,得到了长期广泛的研究。业务流程管理系统是信息化系统中专门用于处理流
客户关系管理是一种旨在改善企业与客户之间的交流的平台,它实施于企业的市场营销、销售、服务与技术支持等与客户有关的领域。 电子商务环境下的客户关系管理是在传统商务
随着汽车电子的发展,车身控制引起了人们广泛的关注。车身控制系统主要是为了提高驾驶的方便性和乘坐的舒适性。车身控制系统涵盖范围很广,包括灯光控制系统、车门控制系统、
随着工业自动化技术和信息技术的不断发展,建立统一开放的通讯协议、构建信息和控制一体化的网络成为网络控制系统急待解决的问题。工业以太网具有通信协议简单、开放性良好
基因表达式程序设计(GEP)是在演化计算尤其是遗传算法(GA)与遗传程序设计(GP)的基础上借鉴生物学进化理论发展而成,在表达方式上,延续了遗传算法线性编码便捷易用的特性;在基