语音情感识别及在人机对话系统中的应用研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lzslzs2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互的逐渐发展,语音作为快速、直接的交流方式,使机器理解语音交互过程中的情感变得更加迫切。由于语言差异、记录语音的环境不同、语音有效情感特征的不确定性和语音存在的噪音等导致富情感的语音特征缺乏有效的提取影响了语音情感识别的效率和有效性。基于机器学习的语音情感识别方法,只能提取特定的特征集作为模型的输入。基于深度学习的语音情感识别可以避免上述特征工程,并自动提取语音特征,但这些大量的语音特征会使模型的识别效率降低,富情感的语音特征得不到有效的提取。本文旨在对特定特征的提取和融合,并基于深度学习算法,研究具有较强泛化能力、高效的语音情感识别方法,并将语音情感识别应用于人机对话系统。在语音情感识别中,有效提取富情感的语音特征是情感识别成功的关键。本文提出互补特征提取方法,并对该方法的有效性进行验证。在语料库方面,语料库是验证方法可靠性的重要元素,本文基于两种常用语料库和一种较新的语料库进行模型的训练与验证。在情感识别算法方面,高效的分类模型算法决定了语音情感识别方法是否有效。本文结合三种语音情感识别语料库,完成特征提取后,将其作为深度学习识别模型的输入。深度学习模型采用了高效的卷积神经网络进行构建,网络结构共有六层卷积层,两层全连接层。每层卷积层后面都采用批处理进行归一化,并调节网络的稀疏性。在语料库对模型进行训练及验证过程中,对互补特征提取方法进行了消融学习,得到的相应结果与三种基线方法进行了对比。经过实验,本文提出的语音情感识别方法优于基线方法,证明了互补特征提取的有效性和深度学习模型的优越性。本文将语音情感识别应用于人机对话系统,结合富情感的人机对话系统,构建了基于Web的对话系统。将语音作为系统的输入,对输入的语音进行情感识别,得到的对应情感结合在线语音识别方式成功将语音情感识别应用于人机对话系统,证明了语音情感识别应用于人机对话系统具有应用研究价值。
其他文献
主要证明了由2-树生成的Cayley图An(△)(n≥5)是(2n-7)容错极大局部连通和一对多(2n-7)容错极大局部连通。限制每个顶点有至少3个无故障邻点,则An(△)(n≥5)是(4n-15)容错极大局部连通。
基于管道声学理论,结合工程热力学和流体力学知识来研究消声器的排气噪声,通过推导消声器出口处的声压,得出消声器的声压级和插入损失,理论计算和实验结果对比表明,这种方法不仅快
探讨了利用实码加速遗传算法的投影寻踪新方法的泥石流危险度评价模型,并给出了相应算法、实例及同其它方法对比应用,表明了利用投影寻踪方法来评价泥石流危险度是有效可行的
对商用车驾驶室弯扭工况进行分析,提出弯扭工况的边界条件和载荷条件。根据弯扭工况的约束和载荷条件,提出进行弯扭工况力学性能分析的试验方案和试验设备。对某型商用车弯扭
针对多传感器数据的多样性,提出一种改进的数据融合算法.首先,利用小波技术消除已收集数据的高斯白噪声并对数据进行压缩;其次,对处理后的数据进行分层,并对系数进行Kalman滤
语言文字运用能力是学生语文核心素养的重要表征之一,教学中的言语实践活动在提升学生的语文核心素养方面发挥着巨大的作用。在新课程理念的影响下,“语言学用”引起了越来越多的语文教育工作者的关注,但反思我们习以为常的语文教学模式和原则,语文教师在实际教学中依旧有意无意地消除了通过语言符号来重新开启意义的世界。因此,如何在语文课堂中贯彻“语言学用”教学理念成为了亟需解决的问题。故本论文以语言为着眼点,采用文
如果,我只是说如果,你对改装高档汽车手痒痒得不得了,并且对类似二环十三郎的行为心动得不行……但是由于金钱和法律的制约,你不得不在某些疯狂想法还没有冒出泡儿的时候就把它们
本文以定位试验,野外调查和室内分析的方法研究了黄土高原南部坡耕地土壤养分流失机理、数量及时空变化规律。
利用算子逼近思想研究各种广义顺从算子构成的集合在B( )中的闭包和内点(即在B( )中的百分比),并进一步研究算子的各种顺从性在各种等价关系下的稳定性.
针对光栅衍射问题提出一种最小二乘算法.在计算区域简单剖分的基础上,选取平面波函数近似解的局部性态,并利用Rayleigh展开的有限项截断近似解在无穷远处的性态.结果表明,该