语音情感识别及其在服务机器人中的应用研究

来源 :东北师范大学 | 被引量 : 4次 | 上传用户:cxz2004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感在人机交互中扮演着重要的角色,语音作为人们日常生活中使用最广泛的交流方式之一,也是传递情感的主要媒介。全球老龄化、少子化、“空巢老人”问题的加剧,为服务机器人的发展提供了广阔的市场前景。新一代人机交互技术的逐渐深入,促使语音情感识别在服务机器人中的应用成为研究的热点。本文围绕语音情感识别在服务机器人中的应用开展了以下三个方面的工作:(1)在传统机器学习领域,提出了基于Zernike的语音情感特征提取算法ZMFCC。语音情感识别的精度与提取的语音情感特征密切相关。MFCC作为语音信号的谱特征之一,充分考虑了人耳的听觉感知特性,因此在以语音为研究对象的相关领域得到广泛的应用。本文对MFCC特征提取算法进行改进,提出了基于Zernike矩的梅尔频率倒谱系数(ZMFCC)语音情感特征提取算法,并结合LIBSVM分类器,实现了CASIA中文情感语料库中六种情感的分类和识别。实验证明,本文提出的算法优于MFCC和HuWSF等基于谱特征的语音情感特征提取方法。(2)在深度学习领域,提出了基于卷积神经网络和随机森林相结合的语音情感识别模型CNN-RF。深度学习可以从原始数据中自动学习、提取高层次的特征。本文针对中文语音数据的情感识别,选用卷积神经网络作为特征提取器,随机森林作为分类器,提出了基于卷积神经网络和随机森林相结合的网络模型CNN-RF。首先将语音信号转化为语谱图并进行归一化,输入到卷积神经网络,提取出语音情感特征,然后采用随机森林算法对得到的语音情感特征进行分类。该模型在中科院的语音情感数据库CASIA上进行训练和测试,实验证明CNN-RF模型优于传统的CNN模型。(3)改进了NAO机器人指令盒,将语音情感识别模型成功应用于NAO服务机器人平台。为了使NAO录制的语音与CASIA中的语音格式保持一致,对NAO自带的Record Sound指令盒进行了改进,机器人通过语音情感识别了解人的喜、怒、哀、乐,实现了更加智能的人机交互方式。
其他文献
创意是什么?就是让自己有童心,笨一点。笨一点才会比较聪明。创意就是一片天空,每受一些教育,天空的一角就会被贴起来,当我们受了越来越多的教育,人变得越来越逻辑,知道了每
以一年生盆栽刺槐无性系苗BH327和BH56为试验材料,研究了NaCl胁迫对生长、体内Na+、K+、Ca2+、Mg2+等矿质离子含量及地上部分各器官对K+、Ca2+、Mg2+(相对于Na+)选择吸收的影
随着木材产品的广泛应用,木材资源在近几年呈现出严重供不应求的现象。竹材具有生产周期短、产量高等优点被认为是木材资源的理想替代品之一。近几年竹材产品在家具、建筑、
本文主要阐述新课程标准及高考考纲对学生掌握语法的要求,并结合近三年新课标全国Ⅱ卷高考英语语法填空的题型、考查方式和考点分析,探索语法填空的解题思路和解题方法,旨在
法治社会的不断发展,给行政主体的职能转变提出了新的要求。由于传统的管理型行政表现出了诸多弊端,向服务型行政转变成为了行政职能的必然趋势。这种趋势是信赖利益保护原则
大众旅游时代的到来,露营地逐渐成为新型旅游的热点,为更好给游客带来最佳体验,亟需一套信息管理系统对营地相关信息进行管理,本文提出基于SAAS模式管理平台综合管理营地多种
近些年来,随着信息技术的快速发展,信息技术在教育领域中得到越来越广泛的应用,传统的教学模式和教育方法受到很大冲击,并促使教育发生了重大变革。但是贫困地区仍然坚持着传统的
随着科学技术的进步,与减速机结合的传统电机已不能满足现代工农业发展的高精度要求。在直驱技术中,电机直接与负载相连,取消了机械变速机构,使其具有结构简单、无磨损,无传
在智能制造,尤其是半导体制造过程中,批间控制(Run to Run控制)是一种广泛使用的控制方法。其控制原理是通过之前一个生产批次完成之后的测量信息来决定下一个生产批次中设备
随着我国经济的高速增长,环境问题显得日益突出,且越来越成为我国经济健康发展,人民安居乐业的重大隐患。当前中国的环保体系对环境恶化所起的调节作用微乎其微,在这种局面下