基于注意力机制的语音情感识别研究

来源 :天津师范大学 | 被引量 : 2次 | 上传用户:jackyray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别技术的迅猛发展使得人机交互界面迈入更加精细化、智能化的时代,已经广泛应用于社会生活的各个方面,成为人工智能领域重要的研究方向之一。近年来,随着深度学习技术的飞速发展,对图像识别、语音识别、自然语言理解等多个领域产生了颠覆性的改变。深度神经网络也被成功地应用在于语音情感识别领域,主要是利用神经网络提取更为鲁棒、有效的情感特征和基于时序关系建立情感模型,同时借鉴其他领域的模型以有效地提升语音情感识别的性能。然而,目前的研究工作存在以下几个问题:首先,已有的深度模型大多仅关注语音情感数据的时序表征或纹理特征,并未将两者有效的结合;其次,目前的研究工作多将任务建模为序列-标签问题,忽略了语音情感序列中细微的情感变化以及这些情感扰动对整体情感识别的影响;最后,目前的研究工作大多未考虑从相似任务中获取知识来指导语音情感识别模型的学习。在本文中,首先针对使用卷积神经网络(Convolutional Neural Networks,CNN)或双向长短时记忆神经网络(Bi-directional LSTM RNN,BLSTM)无法有效提取语音情感时空表征的问题,提出Attention-BLSTM-CNN模型,通过将CNN和BLSTM两个分支采用并行结合的方式,同时提取语音情感的时空表征,然后进一步在每个分支结合注意力机制以提升模型的识别性能;其次,本文使用联结主义时序分类(Connectionist Temporal Classification,CTC)来捕捉序列之间的情感波动,将语音情感识别任务建模为序列-序列的学习问题,并结合注意力机制,进一步提升识别性能;然后,本文基于知识迁移理论,采用Teacher-Student模型,将语音识别任务所产生的注意力图作为知识迁移到情感识别任务之中,使用该先验知识指导情感识别模型的学习;最后,综合上述模型所取得的结果,本文提出一个基于注意力机制的多模型融合策略,采用并行结构设计,结合上述模型的优势,通过注意力机制为不同模型分配权重,融合输出最终的识别结果。本文分别在IEMOCAP数据集和FAU-AEC数据集上进行了实验,使用短时傅里叶变换的方式完成这两个数据集的特征提取操作,并最终应用于基于注意力机制的融合策略。基于注意力机制的融合模型在IEMOCAP库上取得了72.5%(UA)和71.5(WA)的识别效果,在FAU-AEC库上取得了52.1%(UA)的识别效果,取得了较好的性能,充分证明了注意力机制的有效性。
其他文献
通过介绍头孢拉定致血尿的不良反应情况,回顾我国《药品不良反应信息通报》对该药的通报情况及相应的风险管理措施,系统分析药品风险管理各环节的作用及产生的影响,以加深对
<正>本统计期内(10月27日至11月2日)A股在3100点附近表演过山车,两融余额较上期有所回落,但截至11月2日,沪深两融余额再度回到9100亿元上方,收报9140.98亿元。其中沪市两融余
期刊
病例:患者,男,41岁,因“左环指挤压伤5小时,出血疼痛”,于2011年9月2013入院治疗,经X光摄片检查诊断为“左环指末节部分离断伤,末节指骨部分缺损”。患者既往体健,无药物过敏史,无其他
12月是孟加拉国收获的季节。此时在农村地区,金黄的稻田一眼望不到边。在该国东北部锡来特大区逢春甘吉镇,当地农民佳尼特正在弯腰挥镰熟练地收割着稻谷。佳尼特一家9口,共有
总结1例回肠造口回纳术后切口感染的护理经验。通过准确的伤口评估,利用湿性愈合理念及方法,合理清创,选择合适的新型敷料,以达到有效引流、控制感染、促进伤口局部血液循环
新湖中宝(600208):公司近日公告,拟与万得及其创始股东签署合资合作协议:1)新湖与万得通过独立公司开展金融业务领域全方位合资合作,构建机构投资者之间金融资产交易的信息服务平台;2)各方共同选择万得旗下境内公司为目标公司,新湖向目标公司增资人民币28亿元(持股20%)。  此外,新湖以货币资金人民币6亿元,以增资扩股方式取得万得1%的股份。本次合作有利于新湖和万得整合各自资源优势,关注机构投资
没有只涨不跌的股票,也没有只跌不涨的股票,这句话在股市中,持续不断的被验证。过去一年什么涨的最好,回答肯定是创业板。整个指数都已经翻倍了,个股涨3-5倍的很多,很多概念揭竿而起,3D打印、智能机器人、手游概念等等,凡是有故事讲的股票都会被资金炒作。这样的行情让我们想到了2000年美国的互联网泡沫,那个时候,科技股不断上涨,而蓝筹股不断下跌。很多大蓝筹也是跌到了5倍市盈率这样的位子,和目前国内的蓝筹
目的:利用蒙特卡罗方法分析透射平面上散射光子的物理性质以及非均匀模体厚度对散射核的影响,为基于电子射野影像设备(EPID)的在体剂量验证研究提供基础。方法:利用EGSnrc建
上证指数自上周最低跌至2850点后,周四周五开始强烈反弹,指数一跃站上3200点。  本周虽然只有三个交易日,但指数仍处震荡中。后市行情将如何演绎,近日记者采访了多家私募,基金经理们对后市看法呈现出了一定的分化格局。看多者认为反弹行情值得期待,反弹剑指3400点;但是相对谨慎的基金经理亦不少,其中有人甚至认为目前行情短期仍不容乐观,2850点可能不是底,同时不建议投资者盲目抄底。  看多者认为反弹
开放还是封闭,并非水火不容,创新的定期开放基金近几年快速发展,已在中等风险收益基金中具有一定影响力,在目前定期开放基金的四大主流门派中,今年以来利用好定期开放规则,把握住市场节奏的“高手”云集。  定期开放一般是以3个月到3年为一个开放周期的,其中以3个月、半年和1年开放周期为主,投资者放弃一段时期的流动性,让基金短期内不受申购赎回的影响,从而有利于基金经理的投资运作和提高基金中长期收益水平。