【摘 要】
:
随着人工智能和深度学习的发展,人机交互领域越来越注重情感表达,而语音作为表达情感最直接的方式,是实现自然人机交互的重要前提。如何让计算机自动识别人类情感和如何利用深度学习自动提取有效表征语音情感的关键特征是如今研究的热点。本文结合目前流行的深度学习网络构建语音信号特征提取和情感识别的模型,重点寻找有效表征说话者情绪的高级情感特征和模拟人类注意力机制去识别情感。主要工作如下:(1)针对语音情感识别任
论文部分内容阅读
随着人工智能和深度学习的发展,人机交互领域越来越注重情感表达,而语音作为表达情感最直接的方式,是实现自然人机交互的重要前提。如何让计算机自动识别人类情感和如何利用深度学习自动提取有效表征语音情感的关键特征是如今研究的热点。本文结合目前流行的深度学习网络构建语音信号特征提取和情感识别的模型,重点寻找有效表征说话者情绪的高级情感特征和模拟人类注意力机制去识别情感。主要工作如下:(1)针对语音情感识别任务中特征提取单一、分类准确率低等问题,给出一种基于时频特征融合的情感识别算法。本文计算语音信号的Log-Mel特征和一阶差分、二阶差分特征,合并成3-D Log-Mel特征集。将3-D Log-Mel特征集输入到BCNN-LSTM-attention网络中提取频域特征,将语音划分等长度片段输入到CNN-LSTM网络中得到时域特征,融合频域特征和时域特征。在IEMOCAP和EMO-DB数据库上实验证明,特征融合算法与提取单一频域特征或时域特征算法相比识别率提高。(2)保留(1)中提取的3-D Log-Mel特征集,给出一种基于自身注意力时空特征的语音情感识别算法,对关键的时空依赖关系进行建模。利用双线性卷积神经网络、长短期记忆网络去自动学习语音信号的最佳时空表征。引入多组注意力机制,探索语音中的关键帧信息。在IEMOCAP和EMO-DB数据库上实验证明,时空特征融合算法与单一的空间特征或时间特征算法相比识别率提高,同时多组注意力机制提高了整个系统的性能。(3)给出一种在线语音情感识别系统设计,将基于自注意力时空特征模型应用到语音情感识别系统中,所有功能模块通过EXE可执行文件的调用实现,实验结果证明了本文提出算法的优越性和语音情感识别系统的有效性。
其他文献
15世纪的意大利涌现出一批多才多艺的艺术家,他们既是画家,又是文学家,还是建筑师和工程师或是科学家,即——通才。文化史家布克哈特指出,这些艺术家在每一个领域都创造出全新的、完美的作品;除去艺术,他们还对广泛的科学、哲学问题进行钻研。他们在追求自我精神的过程中,突破客观局限,成为意大利文艺复兴文化追求的理想典范。他们对自我精神的坚持、对知识的融合和对局限的突破亦持续影响着后世的西方艺术家与艺术史家。
在中国的经济转型中,经济分权理论具有较强的解释能力。过去的分权强调了中央政府与地方政府在财政权力方面的分配,然而随着1994年分税制改革的实施,地方财权被大大削弱,经济分权的重点也从过去的财政分权过渡到金融分权。本研究首先梳理了中国金融分权的历史进程,接下来考察了金融分权对宏观、中观、微观三个层面的金融效率的影响,最后根据经验研究的结论提出了相关政策建议。本文的主要工作表现在以下四个方面:其一,对
对于数值模式的长期积分来说,质量场的守恒性非常重要。中国气象局自主研发的GRAPES_GFS全球预报系统近几年在取得长足进步的同时,还存以下基本问题:1)动力框架中现在采用的准单调半拉格朗日平流方案精度不高,且不能保证标量场的守恒性;2)动力框架在长期积分的过程中无法严格保证干大气总质量的守恒性。针对以上问题,本论文的研究工作分为以下两个部分:湿动力过程的守恒改造:在数值模拟中如何更好地计算水物质
目的研究呼吸内科护理中重症患者应急护理的干预措施与效果。方法选取本院2019年3月~2019年6月收治的90例呼吸内科重症患者为例,随机分为对照组对观察组,各45例,并对对照组的患者采用常规护理,对观察组的患者采用应急护理干预,对两组患者的护理情况进行观察,并对比两组患者护理之后的生命体征变化及治疗情况。结果经过不同方式护理之后,观察组的总有效率为93.33%,死亡率为0.22%,对照组的总有效率
本文利用1979-2010年NCEP的CFSR再分析资料、NCEP的CMAP降水资料、NOAA向外长波辐射资料(OLR)、降水资料(GPCP)、澳大利亚气象局MJO监测指数及日本“数字台风”网站数据等资料,采用合成分析及波动时空滤波等方法,分析了东亚副热带夏季风建立与撤退的气候学特征及年际变化,主要结论如下:1)气候平均东亚副热带夏季风建立或大气环流由冬季型向夏季型转换完成的时间为第24候,最显著
在当前减税降费背景下,我国财政收入增速放缓,地方财政面临较大支出压力,亟待新的税源进行补充。消费税目前已成为我国主要税种,在筹集财政收入、调节经济方面具有重要作用。本文结合消费税职能,分析现行消费税存在的问题,并从调整征收范围、后移征收环节、央地共享、价内税改价外税、地方分享财力使用等方面提出建议。
内燃机因其具有高效的能源转换与强劲的动力输出特性,受到了各国交通运输企业、国防军工部门和能源动力部门的广泛关注。论文以高性能内燃机缸套为研究对象,针对缸套珩磨表面Rk粗糙度集预测、珩磨加工参数优化、缸套磨损量预测和缸套服役可靠性评估等相关问题进行了研究。为高性能内燃机关键部件的精密加工和整机服役性能的提高提供相关参考。论文的主要内容如下:(1)基于人工神经网络(artificialneural n
植被覆盖度(FVC)是刻画地表植被覆盖的重要参数,也是重要的生态气候参数,并且影响地气间的水分和能量交换,是陆面模式的重要输入参量之一。NDVI(归一化植被指数)作为估算植被覆盖度的一种常用数据源,由于大气条件、地形、传感器退化等多种因素的影响,多源数据存在时空不一致、可比性差等问题,影响数据的综合应用。为了获得更高精度的模拟结果,研究提出了基于非监督分类的局部核回归方法,对多源NDVI产品进行归