基于卷积神经网络特征优化的语音情感识别研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:huangkb009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与人工智能的快速发展,自然人机交互受到广泛重视。语言是人们日常交流的主要媒介,近年来,由于深度学习在语音处理领域的广泛应用,语音识别已取得较好的识别率,但仍未能实现自然人机交互,部分原因是情感在人机交互中发挥着重要作用,而机器不能理解语音中的情感状态。因此,通过语音信号来分析情绪状态的语音情感识别具有重要研究意义,该课题已经引起越来越多的关注。在语音情感识别研究中,情感特征的选取是决定最终识别结果的关键因素。传统的声学特征来源于语谱图特征的再加工,存在因分帧处理引起相邻谱特征相关性被忽略以及谱特征与目标标签不相关的问题,导致语谱图部分特征信息丢失。为此,本文提出通过卷积神经网络从语谱图中提取相关卷积特征,将卷积特征与传统声学特征进行融合,构建基于PCA特征优化的多级SVM模型,以提高语音情感识别系统的识别性能,主要工作如下:(1)语音信号预处理。对语音信号进行预加重、加窗分帧及端点检测等预处理工作后,提取语音信号中的声学特征,包括短时能量、基音周期、共振峰、MFCC及其统计特性,以作为后续特征融合的一部分。(2)基于语谱图的卷积神经网络特征提取与融合。为尽可能避免语音时长不同带来的负面影响及语音信号数据集样本有限的问题,本文先将语音信号切分成奇数个等时长的语音片段并生成相应语谱图,再构建卷积神经网络,从语谱图中提取相关卷积特征,并与传统声学特征进行融合,以作为最终语音情感特征。(3)构建基于PCA特征优化的多级SVM模型。为尽可能区分相似情感,本文通过计算类别间混淆度构建多级SVM模型。同时,采用PCA特征降维方法对每个判决器的输入特征进行最优降维,以达到优化多级SVM模型的目的。通过已有实验及现有研究数据对比发现,本文提出的基于卷积神经网络特征优化的语音情感识别的科学性及有效性。
其他文献
九十多年前的五四运动,无论是对当时的历史环境,还是对现代的社会走向,都产生了极其深远的影响。以张闻天为例,从思想层面上分析五四时代的知识分子,理清他们的思想渊源和特
将营业税转为增值税是中国结构性减税和免税的关键税收改革策略之一。营改增的政策逐步扩大,改革进程进一步加快,作者对公司财务管理方面的营改增的影响进行了讨论,并探究了
本文以北京某水厂为例,研究低温低浊水质处理特点,设计采用臭氧预氧化改善絮凝和过滤效果,同时应用给水改进型聚氯化铝和高效斜管沉淀技术进一步强化处理效果,解决水厂原水低温低
近几十年来,先进密封技术对航空发动机性能提高的显著贡献逐步得到了国内外相关领域学者和研究单位的极大关注。指尖密封良好的封严性能和较低的制造成本,使之成为近年来密封技
现代文明呈现出的巨大的技术力量深刻地改变着教育生活的面貌,人们熟悉的那个“教育。正在渐渐离我们远去。开设“师道与人生”栏目,意图推出一百位老师,几十年为师从教生涯,无数
根据对与青藏高原湿地退化有关的水分、温度和日照等气候背景条件变化趋势及其生态环境效应的研究结果,认为全球和区域气候变化是青藏高原湿地退化的重要原因,其中年度内降水
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在晚清处于内忧外患的情况下,曾国藩曾在京任职期间对农村社会问题进行了详细具体的考察。他从自然灾害、国用不足、兵伍不精、银价太昂、盗贼猖狂、冤狱过多等方面分析了民
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
追踪携程旅游网的发展历程,有四点是促其成功的必然因素:有好的创业构思,选对了正确的市场切入点,知本与资本最有效的结合发挥效用,能持续创新.保持携程旅游网在业内领先的优