基于频谱感知特征的语音情感识别研究

来源 :东华理工大学 | 被引量 : 2次 | 上传用户:lili123456li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类之间沟通和交往当中最重要的方式,因为语音信号不但蕴含了各种丰富的语义信息,还传达流露出人们交流时丰富的情绪状态。计算机进一步去分析语音信号中包含的情感特征,理解其中蕴含的情感信息,是为了更友好更高效更便捷的人机交互,它具有重要的应用价值和巨大的研究意义。但是,根据存在现有语音情感识别中缺乏情感表达关联更加密切的新特征的问题,本文通过查阅大量国内外相关文献资料,学习并深入研究了语音情感识别的相关理论与技术,提出一种新的基于频谱感知的子带感知谱能量特征BPSE,并采用特征融合算法将MFCC和BPSE特征融合得到了BPSE-MFCC新特征用于提升语音情感识别的性能,其主要工作内容如下:第一,针对现有语音情感常用特征提取都是基于物理声学特性,只考虑声音的物理特性,且存在识别率不高等问题,本文提出了子带感知谱能量特征BPSE,解决了现有语音情感识别中缺乏情感表达关联更加密切的新特征的问题;第二,针对提出新的语音情感特征子带感知谱能量BPSE仍较单一,识别率尚未达到最优的问题,采取语音情感识别特征参数选择和融合方法,使用F比与D比的语音情感识别特征参数评价方法,进而将MFCC与BPSE中的最优部分特征进行融合,得到了新的语音情感融合特征BPSE-MFCC,新特征可以有效表达语音情感识别的物理特性和听觉感知特性。第三,构建了基于SVM模型的语音情感识别系统,并在Matlab仿真环境下对汉语情感语料库CASIA和柏林德语情感语音库EMO-DB进行实验,提取了常用语音情感特征、新特征BPSE和新融合特征BPSE-MFCC,并对比分析这些特征的语音情感识别性能。实验结果表明新特征BPSE和新融合特征BPSE-MFCC识别效果均优于常用的语音情感特征,大大提升了语音情感识别性能。
其他文献
目的了解药品不良反应(ADR)的发生特点,促进临床合理用药。方法采用回顾性方法,对用药种类、ADR表现及报告人等进行分析。结果抗感染药所致ADR位居第一,占54.95%,其次为中枢神经系统
全球气候正在持续变暖,这是不争的科学事实。  关于气候变暖,在理解这一概念时,必须把天气、气候和气候变化区别开来。什么是天气?中央电视台新闻联播之后有天气预报,是短期的天气现象,包括刮风、下雨、温度等。  什么是气候?气候是个比较长时间段内天气的平均状态。世界气象组织明文规定以30年为一轮,1961~1990年的平均状态我们称之为平均气候。气候变化并不仅仅指温度升高和温度降低,所谓气候变化是指气候
新中国成立以来,对农村宅基地、农房制度的改革探索一直在不断变化。文章通过绍兴上虞样本分析,提出推进闲置农房激活,需要坚持摸排先行、规划引领、示范带动、产业支撑等四
<正>通过系统评价方法,回顾总结浙江省部分三甲公立医院营养科在原卫生部《临床营养科建设与规范指南》和医改背景下的建设与发展状况,分析营养科在科室建设、业务发展、人才
会议
目的研究纳洛酮对血管性痴呆大鼠空间学习和记忆能力减退的防治作用及作用机制.方法将30只SD大鼠随机分为模型组、给药组和对照组各10只.结扎模型组和给药组大鼠双侧颈总动脉
目的 探讨氟伏沙明与氯丙咪嗪治疗强迫症的疗效与不良反应.方法 将56例强迫症患者随机分为治疗组30例和对照组26例,治疗组患者给予氟伏沙明,初始剂量50 mg&#183;d-1,10 d内剂
<正> 美国的空射型飞马座试验运载火箭已在德莱顿飞行研究中心(Dryden Flight Research Facility)制造完毕,以准备进行一系列的初始载飞试验。 这项由轨道科学公司(OSC)和赫
泄漏检测与修复技术是炼化设备密封点泄漏VOCs排放控制的最佳实用技术。简述了泄漏检测与修复技术的工作流程,分析了美国、欧盟等国外发达国家LDAR技术的应用及发展情况,通过
本刊讯:据《糖酒快讯一白酒》报道,2014年3月27日,由仁怀市酒业协会、茅台集团技术开发公司、仁怀市(茅台)酒文化研究会、仁怀茅台古镇文化产业园区、仁怀市酱香酒酒业有限公司主
通风机是井下铁矿生产中的重要设备之一,是矿井消耗能量的主要设备。目前,建立低碳运行生态矿山成为了铁矿发展的必然趋势,因此,铁矿节能问题也成为矿井研究的热点问题之一。变频