基于自编码器的语音特征编码与情感识别

来源 :武汉邮电科学研究院 | 被引量 : 1次 | 上传用户:proshyrain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来语音相关研究中出现一种趋势,过去被认为在序列数据上表现较好的以循环网络(RNN)为基础的各类模型,开始被时序卷积网络(TCN)超越,并已经在语音识别与合成上取得了突出成果,但在情感识别上的应用尚有较大的空白。另一方面,现有的相关研究离实用化仍有距离,需要从系统方面考虑,在存储、性能与速度方面综合考虑,需要一种有效的特征处理方案进行特征处理。特征学习也是该领域从定性分类进入表示学习的必要阶段。综上,本文的主要工作包括以下两个部分。(1)针对时序卷积网络在语音情感识别课题上的应用空白,鉴于该模型在其它语音处理问题上的突出表现且已被证明能够有效捕捉语音序列中的长距离依赖信息,将该模型与长期以来广泛应用与特征抽取、特征降维以及表示学习的自编码器模型相结合,提出TCN自编码器,并将其应用于语音情感识别中的语音情感特征提取部分。通过以新方法提取特征的方式,尝试获取传统手工特征没有捕捉到的语音情感特征,并尝试得到更好的分类结果。(2)针对语音情感识别中的特征处理问题,这里实质上指的是从特征中提取出一个维度更低的新表示,并尽可能保持新表示的可区分度。本文提出使用对抗自编码器结合传统特征与新特征,并获取原始特征集的新表达。即在压缩特征维度的同时尽可能保留其表示意义,使得该新表达仍能较好地被分类器分类。目的是获取原始特征的精简表达。对抗自编码器通过对抗训练,将原始输入嵌入到预设的先验分布中,得到原始特征新表达。实验结果表明,时序卷积网络能够从数据中提取出传统手工特征未涵盖的新信息,在RAVDESS数据集上与传统特征结合后进行分类的平均召回率达到了76.6%。另一方面,对抗自编码器有较好的特征压缩能力,将原始的434维特征压缩到8维后仍能保持较好的表示能力,在分类器上仍能保持68%的无加权平均召回率。
其他文献
再制造是废旧资源循环利用的重要手段,而拆卸是再制造的重要环节,科学的拆卸方法可有效的提高再制造效率。拆卸序列规划(Disassembly Sequence Planning,DSP)作为一种寻求产品最优或近似最优拆卸序列的方法,好的DSP方法可有效提高拆卸效率和降低拆卸成本。本文针对再制造中DSP的特点及目前存在的拆卸自动化水平不高的问题,进行了面向再制造的机电产品拆卸序列规划与目标检测研究,主要
近年来,随生活质量的提高,人们开始使用化妆品来维持自己肌肤的美丽健康。在化妆品需求的激增,销售渠道多样化的同时,化妆品质量安全问题成为了一个不可避免的问题。为快速有效地达到广告宣传的效果,一些不良化妆品生产厂家可能过量添加《化妆品安全技术规范》内的限用成分,或者添加禁用物质。而消费者会因长期使用添加过量限用和禁用成分的化妆品,造成皮肤过于敏感,甚至影响生育以及发生癌变,因此化妆品安全问题意义重大。
谷胱甘肽(GSH)是一种有益于人体健康的抗氧化物质,在食品工业中有着广泛的应用,如作为保健品、食品添加剂等,还可以作为药物治疗某些疾病。而水稻是世界性的经济作物,是大部
三七总皂苷(PNS)是中药三七的主要活性成分之一,具有抗炎、抗衰老、抗肿瘤、缓解心脑血管疾病等药理作用。PNS中主要单体皂苷为水溶性大分子化合物,难以透过肠黏膜,经口生物利用度低。壳聚糖作为带正电荷的天然氨基多糖,具有良好的生物黏附性和打开肠上皮细胞间紧密连接的作用,促进药物经细胞旁路吸收。为探究低分子量壳聚糖纳米粒(LMW-CTS-NPs)对PNS肠道渗透性的影响,本论文主要进行如下研究工作:1
我国是绿叶蔬菜的种植大国,但收获方式较为落后,机械化程度较低,主要以人工采收为主,造成了人力资源的浪费,降低了经济效益。少有的绿叶菜收获机械也是以留茬切割的无序收获
毛细管电泳(CE)作为一种有效的分离分析技术,因其具有高分离效率、分析速度快、试剂消耗少以及分离模式多等特点,使其被广泛应用于环境、生物、医药和食品领域。然而,CE的进样量少以及光程短的问题使其光谱型检测器灵敏度受到一定的限制。虽然商业化的激光诱导荧光检测器(LIF)以及CE与质谱检测器联用(CE-MS),可很大程度上降低CE的检出限,但昂贵的费用使这些检测技术并不能在大多数的常规实验室推广应用。
超级电容器相对于电池具有更高的功率密度,相较于传统电容器具有更高的储能密度,它可以将太阳能,风能等手段产生的电能滤波或存储进而转化为方便使用的能源,也可以用于电磁弹射,电磁炮等军事领域。电极材料是影响超级电容器性能的决定因素,因此研究更具有应用价值的超级电容器电极材料是人心所向。本文从改变形貌结构,复合材料两方面提升MnCo_2O_4电化学性能;通过XRD,SEM,TEM手段对材料的结构和微观形貌
本文主要研究磁流体方程解的性质,讨论经典磁流体动力(MHD)方程在Lorentz空间中速度和磁场分量弱解的正则性判别,其次得到了广义三维不可压MHD-α方程在Sobolev空间中的低正
目的:明确皮肌炎(dermatomyositis,DM)、多发性肌炎(polymyositis,PM)、肿瘤相关性肌炎(cancer associated myositis,CAM)患者与健康人外周血淋巴细胞亚群水平的差异。比较皮肌炎、多发性肌炎和肿瘤相关性肌炎患者临床特征、炎性指标、心肌酶谱、外周血淋巴细胞亚群、细胞因子的水平及差异。方法:收集2017年12月至2019年6月于我院住院患者105
港口吞吐量的快速增长和高度集聚为港口腹地集疏运系统规划及港城关系带来了重大挑战。进行港口腹地货运量空间分布表达研究,对微观尺度货运量空间分布、新型社会经济数据空