语音情感识别技术研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:neverneverland
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息通讯技术、移动互联网技术的高速发展,人们越来越希望能够以一种智能化、情感化、人性化的方式与计算机进行交流。语音是人类最直接的交流方式,同时也是人类情感的主要载体。语音情感识别技术研究作为现如今一个新兴的研究方向,不仅对人机交互有着至关重要的意义,更对人工智能有着重要的影响。本文在研究和分析现有的一些语音情感识别技术的基础上,首先从超音段特征、谱特征以及一种基于临界带的多分辨率分析的特征入手,对本文所采用的情感特征进行分析;最后首次尝试采用投影字典对学习(DPL)算法来解决语音情感识别问题。本文的主要研究工作如下:1.本文对情感特征的研究,包括以下两点:1)提取了超音段特征中的响度特征和基音频率特征、谱特征中的MEL频率子带能量系数(MFBECS)特征和线性谱频率(LSF)特征。主要对基音频率F0特征的提取方法进行了研究,针对SHS算法存在倍频错误的问题,对SHS算法进行改进。2)因为并不是所有的频谱部分都对人类的感知系统有影响,所以引入了一种基于临界带的多分辨率分析的GPWP特征来对语音情感进行识别,并对该特征中所采用的小波包基函数进行了研究,结果表明coif2基函数的识别性能最好。2.本文研究了基于稀疏表示分类(SRC)的语音情感识别,针对SRC在解决语音情感识别时存在的速度慢且识别效果不理想的问题,首次尝试采用DPL的方法来解决语音情感识别问题。3.本文使用Emodb、Polish、eNTERFACE’05三个语音情感数据库来进行实验。首先对GPWP特征的识别性能进行研究,结果表明该特征的识别效果优于其他四种特征;其次,将本文提取的情感特征组合与相关文献进行对比,结果表明本文的特征组合性能较好;最后,对DPL所采用的原子个数进行了研究,并从时间性能和识别性能两个角度出发,将DPL方法与SRC、SVM、JSLRR和CRC四种识别方法进行了比较,结果表明该方法不仅具有较好的识别性能,同时还具有良好的时间性能。
其他文献
随着市场经济的发展,小企业像雨后的春笋不断涌现,已经成为经济发展的生力军,它在增加就业机会,促进创新发展,稳定经济增长等发面发挥着十分重要的作用。随着其经营规模的不
(3)精密农业工程技术的研究与开发根据目前澳大利亚农业机械化程度和生产条件,新南维尔士州初级工业产品研究中心(DPI)运用摄像系统、电子传感器、计算机等技术和设备,研制开
<正>(2016年9月20日)各位常务理事:我向本次会议通报本会一年来的主要工作情况和今后一段时间的重点工作。一、近一年来的主要工作中国佛教协会第九届常务理事会第一次会议于
近年来,在市场经济的带动下,物流行业蓬勃发展,物流企业面临着日益激烈的竞争。物流活动贯穿于企业经营活动的各个环节,加强物流企业的成本控制尤为关键。如何加强物流企业的
<正> 厦门市同安区西塘小学是一所中等规模的农村小学,学校领导及全体教师把促进学生心理健康发展作为提高学生素质的主渠道。2002年9月,学校被批准为中国科学院心理研究所教
鉴别古琴的优劣,主要从选材、工艺和发音等方面进行。《太古遗音》说,良材“举则轻,击则松,折则脆,抚则滑”。今天人们只能通过龙池和凤沼来观察面板的纹理和色泽,感触其材质
文章从温度控制、湿度控制、通风控制、设施设备的配备与使用、生物安全控制、疾病防控以及养殖模式七个方面,对肉鸡养殖过程的关键技术进行探讨,以期为从事肉鸡养殖以及肉鸡
通过对干扰床分选机的入料筛分、浮沉特性分析,探讨了该厂粗煤泥干扰床分选机分选的可行性。对干扰床分选机的单机检查进行分析,深入研究了干扰床分选机对粗煤泥的分选效果及
品牌作为为企业带来溢价的一种无形资产,越来越受到营销学者们的关注,拥有品牌的企业也立志于与消费者建立长期的品牌关系。但是产品伤害危机事件的发生往往会将品牌置于生死
以98%的浓硫酸为浸取介质,浓硫酸(ml)∶富锰渣(g)=0.57∶1,不加热,强搅拌下反应三个小时,将富锰渣中锰、铁、钙、镁等可溶性物质溶出,锰的浸出率可达97.85%,过滤,洗涤,以MnO2