基于时序深度学习模型的语音情感识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jimgui19810917
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音识别技术的成熟,人们对语音情感识别技术的呼声越来也高,因为语音情感识别技术的发展将使机器步入更加人性化的时代,同时在很多领域都有不可估量的作用,如汽车驾驶、医疗服务、远程教育、疾病诊断等。但目前语音情感识别技术还未达到实用的程度,一方面因为情感活动本身是一种复杂的生理过程,另一方面用于语音情感识别的数据库、模型等还需要进一步的开发。本文从语音情感识别模型出发,针对传统长短时记忆模型(Long-Short Term Memory,LSTM)对所有语音帧信息都要学习的问题,认为情感语音的帧序列中分为情感帧和非情感帧,并提出面向情感语音识别的LSTM-CTC时序深度学习模型,通过联结主义时间分类(Connectionist temporal classification,CTC)方法自动对齐能力将情感标签对齐到语音中的情感帧上。在IEMOCAP情感数据库使用4类情感进行话者独立实验(高兴、悲伤、中性、生气)取得了65.7%(UAR)和64.2%(WAR)的识别性能,比目前性能最好的LSTM-ELM模型提高了2.3%(UAR)和1.8%(WAR)。接着,针对LSTM-CTC模型中对语音情感帧一视同仁的问题,分析认为语音情感中每一个情感帧的情感信息含量不同,所以本文从注意力机制角度出发提出Att RNN-RNN时序深度学习模型,将语音情感识别过程看作是一个编解码问题,考虑到人类的注意力具有从整体到局部的变化特性,使用LSTM作为解码器在每个时间步中计算注意力进行情感识别推断,模拟人类的注意力转变过程。在IEMOCAP数据库的四类情感识别上,获得了67.6%(UAR)和67.5%(WAR)的性能,优于LSTM-CTC模型。但是考虑到CTC方法具有将情感标签与语音帧自动对齐的特性,为了充分利用这一优势,在Att RNN-RNN模型基础上引入CTC方法,提出Attention-CTC融合模型,通过共用一个情感语义编码器,将CTC方法和Attention机制联系起来,CTC负责对齐语音中的情感关键帧,Attention机制负责在不同情感帧中抽取不同程度的信息进行学习。此模型在IEMOCAP库上取得了70.3%(UAR)和65.1%(WAR)的识别性能。最后,本论文实现一个在线语音情感识别系统——OESERS系统,将上述的研究成果转化为实际应用产品。系统采用Client/Server结构,具有良好的识别性能、友好的人机交互界面和大规模并发任务处理能力。该系统为三星Bixby语音助手提供语音情感识别支持。本文的研究工作为目前语音情感识别领域中存在的关键性问题提供了有效的改进方案,经过实验证明,本文所提出的时序深度学习模型对语音情感识别任务效果显著,同时也为深度学习技术在处理时序序列问题上提供了新的思路和方向。
其他文献
目的1.观察幽门螺旋杆菌感染对人胃黏膜上皮细胞内β-Catenin的表达及磷酸化的影响。2.明确CagA蛋白对人胃黏膜上皮细胞β-Catenin的表达及磷酸化的影响。3.探讨CagA蛋白诱导
目的:子宫内膜癌(Endometrial Carcinoma,EC)是一组发生于子宫内膜腺体上皮细胞的一种恶性肿瘤,是女性生殖系统第三大恶性肿瘤[1],占女性生殖道恶性肿瘤的20%~30%。目前子宫
背景和目的肺癌按组织病理学可以分为非小细胞肺癌(non-small cell lung cancer,NSCLC)和小细胞肺癌(small cell lung cancer,SCLC),其中非小细胞肺癌占所有肺癌的80%左右,小
《爱乐之城》讲述了平凡人的寻梦之路,鲜活地展示了一幕幕的付出、妥协、坚守、割舍,精致的爵士背景音乐与戏剧场面构筑了歌舞升平的都市气息,也与男女主人公的情感和理想同
根据牛顿(I.Newton)的惯性定律和加速度定律,物体在不受外力或者所受合外力为零时,保持静止或匀速直线运动状态,这种性质就是惯性;而且物体在所受合外力不为零时获得加速度,发生运动
脱贫攻坚是当前政府的一项重要工作,为实现2020年全部贫困人口脱贫,政府投入了大量的资金进行扶贫。大量的扶贫资金投入是否实现了政策效果,资金使用过程中有无违纪违规,扶贫
[目的]观察赵氏雷火灸治疗心肾不交型失眠疗效。[方法]使用前瞻性设计方法,60例住院及门诊使用赵氏雷火灸施灸,选心俞~双,肾俞~双,配穴百会,涌泉,神门~双,太溪~双,选用雀啄法
<正>第一课时:略读《祖父的园子》一、眼中园:样样都有师:祖父的园子到底是什么样的?带着这个问题,请同学们快速默读课文,找出具体描写园子的段落,争取两分钟完成。(学生快速
1584年,英国最早开始对树莓进行栽培和品种选育,目前树莓已在新西兰、美国、波兰、俄罗斯、苏格兰、加拿大、哥伦比亚、前南斯拉夫地区等地大规模生产。新西兰大部分树莓以果
分析免烫树脂和柠檬酸对柞蚕丝织物进行抗皱整理的效果,通过L9(34)正交试验,优选柠檬酸组合整理剂的最佳配比和其他整理工艺条件。最佳工艺条件为柠檬酸7%,次亚磷酸钠5%,三乙醇胺