基于GA特征融合和决策树结构的语音情感识别技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:jiejie2717
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能人机交互需求的增长,语音情感识别技术吸引了众多学者进行研究。目前的研究方向主要包含语音信号处理、情感特征集提取、情感特征的选择和融合、分类器构建等。考虑到情感特征集和分类器对语音情感识别的最终效果起关键性作用,本文针对这两点进行重点研究,研究内容包括:如何融合不同特征以实现高质量情感识别以及如何构建有效的分类结构获取适应当前情感类别的特征集。本文开展的研究工作如下:(1)针对语音情感识别技术的现状和未来发展进行调研,完成了当前主流语音情感识别技术各个模块的原理分析,主要包括语音情感识别中所需的数据库、情感特征、特征选择和特征融合方法、分类器等模块,并通过实验仿真完成各模块的性能评估。在上述基础上,对语音情感识别技术中存在的问题进行探讨,找出潜在解决方法,为后续研究工作提供理论基础。(2)针对语音情感识别中单一特征不能全面表征情感信息的问题,本文提出一种基于遗传算法融合深度瓶颈特征和声学情感特征的语音情感识别方法。该方法一方面通过提取语音的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、基音频率、能量、过零率等声学特征,用于表征语音中不同情感的声学变化信息,另一方面利用深度神经网络(Deep Neural Network,DNN)提取语音的深度瓶颈特征,用于弥补声学情感特征中缺乏的与分类标签相关联的信息。最后引入GA(Genetic Algorithm,GA)用于搜索融合两类特征的贡献度权值,将搜索得到的结果用于实现两类特征的融合,并使用支持向量机(Support Vector Machines,SVM)实现训练和分类。实验结果表明,基于遗传算法融合能得到更具有情感区分性的特征集,该特征集比单一特征集具备更高的识别性能。(3)由于不同情感对应的最佳特征集有所不同,因此针对当前情感使用适应度更高的特征集可以进一步提升识别效果。在上述情感识别方法的基础上,本文提出树型结构和直分型结构的语音情感识别方法。基于树型结构的语音情感识别对具有相似情感特性的情感使用相同的寻优目标,得到更适应这些情感类别的特征集,并用于情感识别。基于直分型结构的语音情感识别对每一类情感使用不同的特征集,最后实现对每类情感的高质量分类。实验结果表明,两种结构的语音情感识别系统都可以提升语音情感识别效果。树型结构在时间复杂度上优于直分型结构,而直分型结构则可以达到更佳的识别效果。
其他文献
邓小平在总结我国社会主义建设经验教训的基础上,针对我国权力配置不合理的实际情况,提出了构建合理的权力结构所要遵循的原则和实践路径,对我国当前正在进行的政治体制改革,
导体通过交变电流时,由于电磁感应的作用使横截面电流趋于表面分布,产生“趋肤效应”。趋肤效应的存在,使导体自身阻抗随着信号频率的增加而变大,导致传输损耗变大。国内外研
针对各种因素对大学生的专业思想产生的影响,分析其原因,提出帮助大学生树立正确的专业思想的办法,以及逐步构建富有时代特征的多样化的人才培养模式,更加完善高校的教学管理
目的:探讨早期康复护理干预措施对脑卒中偏瘫患者肢体功能恢复的价值。方法:将60例脑卒中偏瘫患者随机分为干预组与对照组,两组患者均给予常规神经内科治疗及护理,干预组在此基础
2011年6月10日晚,第三届中国戏剧奖·梅花表演奖(第25届中国戏剧梅花奖)颁奖典礼在成都西南剧场举行,共有3位秦腔演员获得梅花奖,其中陕西省戏剧家协会副主席、省戏曲研
世界顶级公司透明度排行榜中,挪威国家石油公司以83分(总分10分)的绝对优势稳居榜首。不过,中国公司却集体在该榜上向后站,排名最靠前的中国工商银行也仅名列第76名。据英国媒体报
伴随着经济全球化的到来,我国新时代下的宏观经济形势包括结构调整、转型升级、深化改革等多重任务,目前我国的经济结构、金融市场以及法规税务都在发生剧烈改变,国企的财务
瑞士银行集团(UBS)的"魔鬼交易员"丑闻正在产生持续影响。它不仅导致瑞银集团CEO被迫辞职,更令金融界衍生品市场雪上加霜,与此同时也加速了金融机构改革的步伐。它震动了全球
逐步建立和完善农村金融体系是构建社会主义新农村、实现城乡统筹发展的重要一环,其中农村支付服务发展是农村金融服务乃至农村经济发展的重要条件。相对于城市而言,我省农村
据国家工商总局2012年的数据显示,目前我国西部10省市的小微企业超过160万户,占全国企业实有总户数的16.16%;中部9省市的小微企业超过220万户,占全国企业总户数的22.24%;东部