噪声鲁棒的语音情感识别研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:zkinchow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子信息技术的飞速发展,人们对人机交互体验的需求持续地增加,机器情感智能识别作为人机交互中的重要组成部分,其需求更是与日俱增。在语音情感技术的应用过程里面,总是伴随着各种环境噪声的影响。提取并选择出有效表征情感并且具有高的噪声鲁棒性的语音情感特征以及构建噪声鲁棒性的语音情感分类器,是本文的重点研究内容。本文简要叙述了噪声环境下语音情感识别技术方面的背景,并对噪声环境下语音情感识别的研究现状进行了概述。针对噪声条件下的语音情感识别任务,在最优小波包基的构建的基础上,利用短时帧分析与长时帧分析相结合的方法,并且利用具有较好噪声鲁棒性的子带频谱质心参数进行加权,本文提出了一种基于长时帧噪声补偿的小波包倒谱系数特征(Long time frame Analysis Weighted Wavelet Packet Cepstral Coefficient,LW-WPCC)提取算法。基于语音片段轨迹模型,给出了一种用于计算语音特征携带情感信息的量化准则函数,从而对高维的LW-WPCC特征进行特征选择。针对语音情感识别中的测试样本中普遍存在的噪声问题,通过计算重要性权重,对支持向量机(Support Vector Mach ion,SVM)分类器等效优化问题中的松弛变量进行加权,改进了传统的支持向量机的噪声鲁棒性。并通过混噪语音信号在不同信噪比水平下的情感识别实验,对本文中提取的LW-WPCC特征在噪声情况下语音情感识别能力进行分析评估,相比于传统的语音情感特征和支持向量机,改善后的情感识别方法拥有更出色的噪声鲁棒性和语音情感识别识别准确率。最后,给出了一种基于DBN网络的特征融合算法,将传统声学特征中的韵律特征,音质特征与WPCC以及LW-WPCC特征融合,通过对比实验对基于DBN网络的特征融合算法提取的融合特征在噪声情况下进行语音情感识别能力的分析评估。不同信噪比的混噪语音信号情感识别结果显示,改进的基于长时帧噪声补偿的小波包倒谱系数特征具有更好的噪声鲁棒性以及情感识别准确率。
其他文献
消费金融公司、电商系消费金融平台及小贷公司由于不能向公众吸收存款,寻找低成本资金来源就成为他们的一个重要需求。商业银行传统利润空间逐渐收窄,主动寻求向大资管的经营
改革开放至今已经38年了,在这30多年的历程中,我国社会取得了举世瞩目的成就,政治、经济、社会、文化、教育等各个领域都获得了深刻变革和巨大发展。作为高等教育重要组成部
随着“开放网络”与“网络中立性”概念的提出,网络服务提供商(Internet Service Providers,ISPs)理应为用户提供公平、非歧视的网络服务。但是出于利益,在网络资源分配以及
随着通信网络技术应用的不断普及,通信网络的建设迎来了一个新高潮。通信站是通信网络中的一个重要基础组成部分,承担动力供给、环境控制、基础保障等功能。随着我单位专用城
当终端在异构无线网络中移动或漫游时,垂直切换能有效保证通信的连续性和移动用户的服务质量(Quality of Service,QoS)需求。一方面,考虑到网络状况具有时变性,且不同业务类
本研究以伊犁河谷人工生态经济林为对象,采用实地调查与资料收集相结合的方法,搜集主要造林树种并对其生态学特性进行整理分析,利用专家打分法结合数学模型对各树种适宜性进
针对工作在ISM频段的无线传感网面临的频谱资源紧缺问题,本文将认知无线电中的动态频谱分配技术应用到无线传感网中,使无线传感网能够二次利用频谱,不仅可以改善频谱利用率低
目前,在传统视频监控系统中普遍是通过工作人员监控和录像来实现安全防护,但依旧存在信息遗漏,反应不及时等情况,因此不能准确高效的监控所有场景。而智能视频监控则可以有效
供应商管理库存(Vendor Managed Inventory,VMI)模式是在供应链集成管理理念的基础上,上下游企业以获得最低成本为目的,在框架协议的作用下由供应商管理库存的新型的库存管理
蔚县历史上有"八百村庄八百堡"之称,是全国第二批国保文物大县。蔚县有一处形制标准、保存完好的古堡,并于2013年列入第二批国家传统村落名录,这就是水东堡。水东堡位于蔚县