【摘 要】
:
在语音情感分类算法中,目前大多数基于深度学习的方法存在没有考虑时域和频域的特征进行建模,且网络训练时间长、识别率不高的问题,提出了一种基于神经网络的语谱图情感分类
【机 构】
:
昆明理工大学信息工程与自动化学院 昆明650500
论文部分内容阅读
在语音情感分类算法中,目前大多数基于深度学习的方法存在没有考虑时域和频域的特征进行建模,且网络训练时间长、识别率不高的问题,提出了一种基于神经网络的语谱图情感分类算法.首先选取语谱图作为模型的输入,且为了减少语音情感特征提取过程中浅层特征和训练时上下文细节特征的损失,神经网络模型采用带有残差块的ResNet18网络和嵌入注意力机制的双向长短时记忆(BLSTM)网络的融合模型作为改进,利用ResNet18提取语谱图特征,然后使用注意力机制对其进行特征加权,在BLSTM网络中对加权后的特征进行训练和分类,最终该模型在CASIA数据集上的识别率分别为88.2%,与其他方法相比,所提算法有更好的语音情感分类效果,并且大幅度缩短了整体训练时间.
其他文献
5月19日去301医院告别病逝的解放军艺术学院原副院长赵骜将军,归来后的整个下午,乃至晚上,茶食懒咽,仰卧不宁,眼前总浮现起他那青灰无泽却颇为安详的面容。此刻,我在心中默默
参芪扶正注射液是丽珠集团研制的中药新药,批准文号:国药准字Z19990065。具有益气扶正功效;临床可用于肺脾气虚引起的神疲乏力,少气懒言,自汗眩晕等证,对肿瘤具有明显的抑制
为了对封闭容器中的液位高度进行实时测量,设计了一种线性调频连续波体制的导波雷达.雷达天线采用同轴导波杆,主控制器采用Xilinx公司ZYNQ系列芯片,完成了雷达系统控制程序的
装有视觉传感器的移动机械臂对于未来工厂有着重要意义,如何使移动平台有效地参与到轨迹规划过程中、减少相机标定误差与外界因素对视觉伺服精度的影响是需要解决的部分问题.
无人飞行器在陌生场景中的自主路径规划与着陆工作一直是相关领域研究的重点,提出了一种基于激光雷达采集到的点云数据来给飞行器推荐最优着陆地址的方法.该方法通过飞行器位
随着现代社会的高速发展,多智能体系统编队控制在军事、航天等多个领域展现了广阔的应用前景,逐渐成为了自动控制领域的研究热点。梳理了多智能体系统(MAS)的研究脉络,首先,介绍了多智能体系统的研究背景;然后,分析领航者跟随法、基于行为法、虚拟结构法和图论法这4种常用的编队控制方法及虚拟势场法等非主流编队控制方法,研究并综述学者多年来的研究成果;接着,分析了编队控制的4个研究内容,即队形生成、队形保持、
新一轮课程改革的实施,促使我们不断更新教育教学理念,使教学的内容、方式、评价都在发生着深刻的变化。现行的《小学数学学科新课程标准》中指出:“对学生的评价不仅要关注
文章主要探讨了在大学实用英语教学改革背景下的大学实用英语教材设计问题,讨论了在建构主义和连接主义的指导思想下,《享在剑桥》教材教学设计和二维理论应用于编写和教材教
机械振动工程中存在极端低频和极端高频信号,现有基于FFT的频谱分析法在测量极端频率信号的相位差时存在较大误差.为改善算法性能,首先对极端频率信号进行频谱分析,阐述其中
数学是一门非常重要的基础自然学科,如何让每一位学生都比较好地掌握,尤其对于即将面临中考的初中生来说,数学成绩的切实提高,早已是每一位一线数学教师所必须面临的重要问题