基于长短期记忆和卷积神经网络的语音情感识别

来源 :南京邮电大学学报(自然科学版) | 被引量 : 0次 | 上传用户:rocket830214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高语音情感识别的准确率,提出了一种基于长短期记忆(LSTM)和卷积神经网络(CNN)的语音情感识别方法。首先提取语音信号的梅尔(Mel)频谱序列作为LSTM网络的输入,利用LSTM网络提取语音信号的时域上下文特征,在此基础上再利用CNN从低层特征中学习提取更高层次的情感特征,并完成对语音信号的情感分类。在eNTRAFACE’05、RML和AFEW6. 0三种不同的情感数据库上进行了情感识别测试,实验结果表明,文中提出的方法在上述三种数据库上获得的平均识别率分别为49. 15%,85. 38%和37. 90%。此外,和传统的语音情感识别方法以及基于LSTM或CNN的语音情感识别方法进行了对比,验证了文中提出方法的有效性。
其他文献
结构光照明显微镜是一种结合结构照明技术与宽场成像原理实现表面形貌测量的新工具。为方便调节物面光强和照明视场大小,并保证结构光条纹的均匀性,基于科勒照明原理提出利用
进行横截面为菱形的板式换热器垫片压缩回弹特性试验研究,揭示了梯形槽对垫片密封压力的重要影响。在垫片压缩比相同的条件下,约束压缩可提高压应力9.65%~79.42%。分别利用Moo
农村信用社在成立初期,仅仅发挥了其最基本的财务核算职能。为了完善农村信用社的现代管理制度,我国提出了许多的金融体制改革方案,极大地强化了农村信用社的管理、监督和预
熙宁变法在现代历史视野中长期被关注的焦点是变革与保守的冲突,而本文提出,理性法制诉求是其变革求新的方向和内容,因而是其更本质的特征。这一本质特征呼应着北宋时期出现
基于E格式电网结构数据和特定时间断面下主变、线路的负载数据,生成了配电网功率流拓扑,在此基础之上设计了用于辨识配电网薄弱环节的快速算法,对电网中的设备过载、变电站单
目的探讨喉癌切除术后咽瘘发生的相关因素。方法回顾性总结2012年1月~2012年12月首次住院的124例喉癌手术患者的临床资料,应用SASS 9.2软件对影响咽瘘的因素进行统计学分析。
在国家科技基础性工作专项的支持下,西部重点矿区土地退化因素调查工作于2014年初正式启动。按照总体调查方案,需要对51个煤矿区作一般性调查,对12个重点煤矿区、17个重点金
为了从拾取的振动信号中获取刀具的磨损状态,比较了ChebyshevⅠ型滤波器和Butterworth滤波器的振幅特性,对所获信号进行降噪滤波,并对滤波后的信号进行频谱分析。经分析发现,
回顾了中国 2 0世纪地图学的理论研究与技术进步 ,包括古地图的发现、国家地图集的编辑、地图科学原理与方法的研究、地图科学利用等领域的开拓、遥感与地理信息系统的兴起等