基于特征选择与融合的语音情感识别研究与实现

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:zsdown520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络通信技术和多媒体技术的飞速发展,新型的人机交互已成为计算机应用技术研究的重要方向,而语音的情感识别对实现人机自然交互至关重要。在心理学、生理学、神经科学和计算机技术及与之相关的模式识别技术发展的基础上,语音情感识别的研究在理论和应用上都取得了长足进步,初步建立起语音情感识别体系框架。但随着人们对情感识别应用需求的增多,现有的技术与方法已不能满足需求,特别是汉语语音情感识别的研究相对较少,这就需要加快工作步伐,填补这方面的空白。本文以人机自然交互为背景,分析了语音情感识别目前存在的问题,研究了语音情感识别中的几个关键技术,主要内容包括:(1)普通话情感语音数据库的建立。本文提出了以文本信息引导的录音法及影视资料剪辑法共采集1450句情感语音,分为愤怒、害怕、高兴、中性和悲伤5个情感类别。(2)声学特征的分析与特征参数选择。本文分析了情感语音的声学特征在不同情感状态下的静态规律以及在情感状态转变时的动态规律,提出了二阶段特征选择法。通过该方法选出了实验样本中类内距离小、类间距离大的特征子集,提高了识别率。(3)统计特征和时序特征的融合。通过矢量量化技术,将声学的统计特征和时序特征进行融合,通过实验确定了特征参数在特定情况下的最优配置。(4)基于神经网络的语音情感识别系统。本文综合前面章节的各项技术,设计并实现了普通话语音情感识别原型系统:ERSNN。本文在情感语音库的建立、情感声学特征的选择与融合以及小型的语音情感识别系统的实现等方面提出了一种新的思路和有效的解决方案,为语音情识别的进一步研究提供了可行的参考。
其他文献
近年来,数据挖掘(Data Mining,简称DM)技术的发展已经引起了信息产业界的广泛关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。对数据挖掘技术进行深入
本体最初是一个哲学概念,用来描述事物的本质。在计算机科学领域,本体被定义为共享概念模型的形式化规范说明。目前,本体的构造还没有一个统一的标准,所以在同一个领域内产生
学位
传感器网络作为一种新型采集数据的技术手段,无论在军事领域还是民用领域都受到了越来越多的关注。而路由协议是无线传感器网络的重要组成部分,负责在源节点和目的节点之间传
针对纺织企业生产信息化和网络化发展的需要,设计了一种利用企业内部局域网,将企业的生产车间与各厂级的计算机进行联网,由主机监控、客户机分工序进行产量和质量控制、网络化在线监测的C/S模式的织机监测系统。该织机监测系统是集单片机技术、网络技术和数据库技术,面向纺织企业开发的用于各种喷气织机,集监测和管理为一体的生产信息管理网络系统,可以实现对生产过程中的产量等信息进行在线采集和处理,也包括实验设备仪器
学位
增强现实技术(AR-Augmented Reality),是随着虚拟现实技术(VR-Virtual Reality)迅速发展和实际应用需要而出现的一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,是一种将真
可重构系统资源管理是影响动态可重构系统性能的关键因素之一。针对此问题,本文在基本扫描线算法的基础上提出了一种改进的管理可重构系统资源的算法。该算法为每一个最大关
“VoIP通信系统”的硬件由语音模块和管理PC组成。其中,语音模块是堆叠了4片Infineon VINETIC-2CPE EDSP语音处理芯片的VoIP板卡,每个芯片支持2路电话通道,VoIP板卡可支持8路
随着互联网时代的到来,“大数据”的概念已经越来越被人们熟悉。推荐系统随着用户规模的激增,出现了用户冷启动、推荐实时性与准确性不足等各个方面的问题。本文针对这些问题