基于注意力机制的语音情感识别的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:doudou2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别的目标就是模仿人类的感知机制,最主要的任务就是从一段语音信息中,提取和情感有关的特征,然后对这些特征使用特定的模型进行计算,最终获得每段语音的情感结果标签。在该问题背景的基础上,本文进行以下研究:1、语音特征的提取:MFCC特征的缺点是忽略了特征之间的高度相关性。特征之间的相关性会被深度学习的网络结构更好的去提取,使得模型得以更好的训练。针对这一缺点,本文提出使用log fbank特征。log fbank更好的保存了特征之间的相关性,更适用于基于神经网络的模型。经过实验获得了比MFCC更好的效果;同时使用一阶差分和二阶差分保留时频谱中的动态信息,辅助信息进一步提高模型的识别准确率;并尝试试验了不同的特征组合方式,找出得到最优实验结果的方式;在此基础上进一步对CNN卷积来获取更深层次特征进行研究,并展示了比原实验效果更好的表现。2、自注意力机制研究:语音作为输入也有自己的时序信息。对于某一帧语音,它前面或者后面会有某一帧或几帧语音上的滤波器特征对该帧有一定的影响,针对这样的结构,本论文提出了自注意力机制模型来对特征进行训练。针对时序信息使用自注意力(self-attention)机制去抓取相关权重信息,并摒弃了RNN单元,这样可以极大利用GPU的并行性去提高训练的速度;同时在模型的基础上做了一些创新,借鉴NLP领域让模型自行学习词向量的方法,使用位置向量矩阵算法去获取序列的相对位置信息;并将注意力机制获取的信息进行更深层次的一维卷积;3、胶囊网络模型研究:胶囊网络和注意力机制在原理上有着相似之处,都会计算各层表示,胶囊网络的存在概率可以等同于注意力机制的注意权重等,论文针对他们的异同点进行研究,认为胶囊网络是一种特殊的注意力形式,并研究了胶囊网络对情感识别的影响,结果发现胶囊网络对情感识别也有一个不错的效果。
其他文献
金属铜(Cu)作为人类生产生活中的重要金属,因其良好的导电性和导热性被广泛应用。随着现代工业社会的飞速发展,金属Cu除在超大规模的集成电路、电源线中大量使用外,在航空航天、桥梁建筑等多方面也起着越来越重要的作用,同时也对其提出更高的要求。例如,在航空航天领域,高温高压、大气层摩擦等均对金属Cu的耐高温性提出较高的要求。现有的提高金属Cu的抗氧化方法中,通常有合金化、喷漆、钝化等方式。然而,这些方法
目的考察不同辅料对胃康宁片中薄荷脑的包合情况。方法以薄荷脑含量为指标,采用经典恒温法,比较薄荷脑经各种辅料包合前、后的稳定性,分别计算有效期。结果加速实验结果表明,
近年来,随着互联网技术飞速发展,互联网的各种应用已经渗透到社会的各个领域,并发挥着巨大的作用,改变了人们的生活方式、工作方式、乃至思维方式。越来越多的组织引入互联网相关技术来提升工作和决策效率,开发出了各种软件应用系统,使得系统的权限管理变得至关重要。虽然Apache Shiro与Spring Security两个权限框架有较为广泛的使用,但是在现实应用中却缺乏灵活性。本论文基于扩展的RBAC模型
基于MEMS陀螺仪、MEMS加速度计及三轴磁力计的航姿系统具有功耗低、成本低的优点,在海洋无人艇及小型飞行器等领域具有广阔的应用前景。低成本航姿系统通过MEMS陀螺仪和MEMS加速度计解算载体的姿态,以磁力计的信息补偿陀螺仪的零点漂移。当载体在磁干扰较严重的环境中运动时,磁力计的输出会有较大误差,导致AHRS的姿态解算产生误差。为解决载体在磁干扰环境中的航姿解算问题,课题主要研究工作如下:首先,本
房地产行业是我国近二十年来经济发展的支柱产业,伴随着我国改革开放的步伐,20世纪80年代中国房地产开始成为一种产业,进入萌芽阶段。1984年,邓小平首次肯定了房地产行业的意义,地产行业迎来了它的第一个黄金十年。到了 20世纪90年代,我国房地产行业进入高速增长期,内地房地产行业也开始逐步发展起来。进入21世纪,政府将房地产作为新的经济增长点和国民经济支柱予以支持,房地产行业进入突飞猛进的阶段,各地
道路交通拥堵问题给人们的出行带来很大的隐患,同时也成为制约城市发展的一个因素。对交通流进行预测可以使交通管理部门根据预测结果及时进行交通诱导,从而合理的分配交通资源,改善交通环境。本文交通流数据取自贵州省贵阳市南明区,所以本文以该区域做为研究对象。首先基于该区域路网电子地图数据和交通流数据做了基础分析,根据小波阈值去噪理论对交通流数据进行去噪处理,同时对该区域路网结构及重要道路空间分布做了相关研究
光子晶体在实际制备过程中总会不可避免地人为引入无序效应。一方面,无序效应使光子晶体的目标传输特性受到影响,降低既定目标光学性能,另一方面,无序光子晶体不仅在自然界中动植物的生命活动中具有重要的作用,而且在光子器件、随机激光器、太阳能电池等领域也有着广泛的应用前景。因此,研究无序光子晶体的光传输特性,无论在理论上还是应用上都具有非常重要的意义。其中,一维光子晶体具有结构简单、易于制备等特点,被广泛应
作为数字经济时代的突出代表,电子商务在促消费、保增长、调结构、促转型等方面均展现出前所未有的发展潜力。随着电子商务的持续快速发展,各行业都迎来新的发展契机。物流行业作为电子商务线下服务的载体,拥有无限发展前景,同时也面临巨大的挑战。物流体量的不断扩大对物流服务质量的要求也相应提升,虽然各大物流企业都在加强技术投入以提高物流服务质量,但在与实际消费者的服务交互过程中,难免会出现纰漏。第三方物流服务质
高效的蓝光发光材料对于促进有机发光二极管(OLED)在全色显示及固态照明中的实际应用至关重要。本论文的研究目标是合成出新型宽禁带咪唑类和三苯胺类小分子材料,分别将其作为发光层以及空穴传输层应用在深蓝光OLED中,进而通过优化器件结构来提高器件的发光性能。此外,我们设计出结构新颖的电荷产生层(CGL),结合上述两类材料制备出高效率的串联式深蓝光OLED。本文内容包括以下几个方面:1.合成出一系列新型
如今,无人水下航行器(UUV)被广泛应用于许多应用领域:比如用于勘探和监视考古遗址等科学任务,或完成大深度下的商业探索任务,比如利用它们勘探地形,以便发现附近的石油和天然气,以及在军事领域开展侦察和巡逻任务甚至进行搜救任务。对于执行任务的UUV而言,路径跟踪是其典型任务之一,而研究面多UUV路径跟踪的体系结构、定位方法和控制方法也是UUV领域的重要课题。本文主要研究水面母船支持下的多UUV定位与路