【摘 要】
:
情感识别是计算机视觉、模式识别等领域的研究热点,并随着人工智能和深度学习技术的发展,受到了广泛研究者的关注。表述情感的方式各种各样,其中语音和表情是两种最直接、最
论文部分内容阅读
情感识别是计算机视觉、模式识别等领域的研究热点,并随着人工智能和深度学习技术的发展,受到了广泛研究者的关注。表述情感的方式各种各样,其中语音和表情是两种最直接、最可靠的情感载体,结合语音和表情的多模态情感识别方法研究具有重要的现实意义。针对说话人、说话风格、环境等其他与情感无关因素影响导致语音情感识别准确率低的问题,给出了基于注意力模型和卷积神经网络的语音情感识别算法。利用卷积神经网络对图像的处理能力以及对时间序列数据时频特征有效的提取能力,将静态、一阶差分、二阶差分的Mel频谱作为神经网络的输入数据,再利用注意力模型识别和删掉静音帧和情感无关帧,保留有效的情感信息,最后通过Softmax分类器进行语音情感分类。通过在IEMOCAP和Emo-DB数据库上进行实验得到89.25%和88.57%的识别准确率,与在IEMOCAP数据库上识别率最高的基于多核学习算法融合音频特征得到84.52%的识别率相比,本文算法提高了4.73%;与在Emo-DB数据库上识别率最高的基于BP神经网络进行特征选择方法得到86.11%的识别率相比,本文算法提高了2.46%,为下文提高多模态情感识别准确率做准备。针对声音易受到周围环境噪声影响而导致识别率低的问题,利用不同模态情感信息的互补性,给出了融合语音和表情的多模态情感识别方法,分别采用特征层融合和决策层融合策略对语音和表情信息进行融合,并对传统融合算法进行改进,给出一种特征层和决策层双融合的多模态情感识别算法,不仅保留了不同模态情感信息之间的差异性,还保留了情感信息之间的相关性。在e NTERFACE’05多模态情感数据库上进行实验,识别效果可达89.3%,与目前识别率最高的基于核空间特征融合方法得到的83.92%的识别率相比,本文算法提高了5.38%的识别准确率。
其他文献
神经机器翻译(NMT)模型凭借着优异的翻译性能迅速成为机器翻译领域的主流模型。神经机器翻译模型的训练通常依赖于双语平行语料,是否拥有足够数量的双语平行语料往往是机器翻
目的:本文以《针灸内篇》为研究对象,对该书的学术内容及学术思想进行分析、研究和探讨,对现代针灸临床研究提供理论依据。方法:本研究采用中医文献方法学对《针灸内篇》相关文献进行查找、筛选、收集;采用传统文献学方法对收集的文献进行整理归类;运用医学史方法从学术史的研究“针感”、“十二经穴排列顺序”及“沿皮刺”的拓展过程;运用理论分析方法对文献资料从针灸理论的角度进行分析;运用统计学方法对十四经脉腧穴针刺
路面耦合式(Through-the-road,TTR)混合动力车辆构型是一种在路面上实现动力耦合的混合动力结构类型。通过给发动机增加BSG电机及给非驱动轴增加电驱动桥,即可将传统燃油车辆改造成为TTR构型混合动力车辆。该构型车辆可实现多种驱动模式,配合合理的能量管理策略,可以充分协调车辆动力性及经济性要求,因此具有广阔的发展前景。本文以该构型混合动力车辆为研究对象,根据性能要求进行动力参数匹配,提
如何在地膜减量条件下维持旱地玉米生产力,并有助于土壤培肥是目前旱地农业生态系统管理中的关键问题。土壤微生物在农业生态系统中提供了一系列重要的生态服务,尤其是土壤有
在家庭环境下,让机器人具备多种操作技能可以完成更多复杂的家政任务,为用户提供更好的服务体验。已有技能学习方法需要大量的训练数据,对硬件要求高,特别是不能利用已经学到
森林火灾的频发威胁着林火消防员的生命安全。林火消防员在扑火过程中由于高温休克、吸入毒气昏厥、失足跌落受伤的事情时有发生。为了提高对林火消防员生命安全的保障,一种
随着我国高铁事业的迅猛发展,中型铁路站房在国内不断涌现。本文以某中型铁路站房公共区为研究对象,利用客流模拟软件,得到进站通道所需尺寸,进而确定基于反恐安检需求的公共区平面结构;进一步优化公共区布局,并对其客流区域环境特性及舒适性进行模拟分析。本文通过文献及现场调研,获取了车站的进站流程、服务设施尺寸、服务能力、实际运行情况等重要信息。采用客流模拟软件建立了客流模拟模型,并根据调研数据验证模型的准确
钢筋混凝土结构的耐久性问题是土木工程领域关注的重点问题之一。耐久性不足会导致混凝土结构在没有达到使用年限时就提前失效,对这些失效混凝土结构的维修和重建给我国经济带来巨大损失,混凝土结构的耐久性问题是一个当前亟需解决且意义重大的问题。钢筋锈蚀是导致混凝土结构耐久性失效的主要原因。钢筋锈蚀会导致混凝土保护层开裂、钢筋自身力学性能劣化,同时钢筋与混凝土之间的黏结力也会下降,最终降低混凝土结构耐久性,缩短
细胞是生命体最基本的结构和功能单元,对其形态结构等信息的识别分析在生命科学、临床医学等领域具有重要的意义。大多数细胞无色透明,属于相位物体,传统显微镜难以对其成像
随着信息技术的飞速发展,海量的文本数据不断增长。与数值数据不同,文本数据的处理更为复杂和困难。容错粗糙集模型是对经典的粗糙集的扩展,把论域基于等价关系形成的划分扩