基于时频上下文信息的机器人语音情感识别研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:gideonkim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别一直以来都是计算机视觉和机器学习领域的研究热点,“情感计算”这一概念在近几年已经引起了国内外许多情感分析专家的关注。说话者的语音信号中往往包含了丰富的情感信息,来帮助他更好的传递信息。同一个人用不同的情感表达同一句话时,其传递的信息可能不太相同。为了使计算机更好地理解人的情感,就必须提高语音情感识别的准确率。如今,语音情感识别在人工客服,远程教育,医学辅助,和汽车驾驶等人机交互领域的应用越来越广泛。语音信号的不同语气可以传达不同的情感,让计算机准确的识别语音情感是一项极具意义的任务。许多公开的情感语音库识别算法在对非限制条件下采集到语音信号的识别效果不佳,这些情感识别算法距离实际应用仍有较大的差距。传统的情感识别算法通常只是用到语音的时间信息或者是频域信息,但是情感的变化是一个动态的过程,它在变化的过程中具有非常明显的动态变化特征,也就是情感上下文信息,该信息一般使用连续帧语音信息来表示,利用LSTM算法来获取,提取语音情感的上下文信息特征能够有效提高情感识别率。针对以上所述,本文采用基于时频上下文信息的方法来提高语音情感识别的正确率和鲁棒性。本文的研究内容如下:(1)调研了常用的语音情感特征提取算法和分类方法,并对经典的语音情感识别方法进行了介绍,对比了各种语音情感识别方法的识别正确率,并分析了这些识别方法的优劣;(2)提出了针对机器人语音情感识别的特征提取方法,由于近年来,卷积神经网络在识别领域取得了巨大的成功,本文将其引入到情感识别领域并取得了不错的效果;为了进一步提高情感识别的正确率,本文除了利用语音信息的时域上下文特征外,又介绍并引入了语音频域的上下文信息特征进行识别,提高了整个系统的识别正确率;(3)提出了融合时频上下文信息的方法,把提取的时间域和频率域上下文信息特征进行融合,在知名的语音情感数据集上进行了实验,得到了不错的识别效果。最后,将基于时频上下文信息的语音情感识别方法应用于机器人后端的语音情感识别模块,实现智能机器人的语音情感识别功能。
其他文献
人类感知外界的变化,需要借助五官。而在物联网领域,传感器就相当于人的五官。因此,传感器在物联网领域扮演着不可或缺的角色。近年来物联网领域飞速发展,传感器也被应用于各个领域。磁阻传感器可以将磁场的变化转变为电信号。因此,磁阻传感器应用范围很广,在许多领域都有应用。例如,航空航天、医疗、海洋等各个领域。随着集成电路的发展,电路的尺寸越来越小,这就为传感器的应用提供了便利。因此,完善一款磁阻传感器专用的
幼儿园是针对幼儿实施教育和管理的一类重要的教育机构,肩负着推动学前教育事业发展的重大使命,但幼儿伤害事故案件近年来频繁发生。在幼儿伤害事故的教育机构侵权责任案件中
科技文献服务平台担负着社会创新活动知识资源保障的重任,是学术工作者检索、查看、获取文献的主要来源,文献检索则是其提供的最基本的系统功能,因此完善检索功能、提升检索效果是平台优化最基本的方向之一。科学有效的检索结果呈现方式是文献检索的重要环节,如何将检索结果多维度地、直观的呈现给用户,从而提高检索准确度和检索效率就成为了科技文献服务平台发展过程中急需要解决的问题。通过调查和分析发现,当前科技文献服务
作为一家知名度和美誉度颇高的优秀书(画)类学术期刊,《书画世界》杂志自1992年创刊以来,便伴随着中国书(画)艺术的发展,为当代书(画)艺术的研究提供了宝贵且丰富的资源,因而
生物特征识别已广泛应用于监视应用,法医学和刑事调查。由于生物识别系统可以提供比传统的个人身份验证系统(例如令牌或密码)更高的安全性解决方案,其中令牌可能被盗,长密码或密码难以记忆并且可能被遗忘。此外,随着对法医学和诸如访问控制,移民和商业应用等安全领域的更多安全系统的需求的增加,生物识别系统最近引起了很多关注。近年来,耳印由于其显著的优势,受到了生物统计学界的广泛关注。人耳很大并且可以获得,对年龄
美国作为世界上教育管理制度最为完善的国家之一,非常重视教育法治,在公立中小学不合格教师退出方面更是具有完备的管理制度,积累了丰富的管理经验。美国公立中小学的不合格
在党的十九大报告中,习近平总书记指出,眼下我们国内和国外的形势正在发生深刻复杂的变化,而目前仍然是我们国家发展壮大的重要战略机遇期。在这特殊的环境下,我们的前途是光
人工蜂群(ABC)算法是一种模拟自然生物群智能的优化算法,对于处理连续函数的优化问题具有较强的适应性。目前,已被广泛用于机器学习、组合优化、数据挖掘等诸多领域。然而,ABC算法具有着诸多优点的同时,也存在着诸如收敛速度较慢、较易陷入局部最优等缺陷。膜计算是生物计算领域的一个分支领域,其计算模型被称为膜系统或P系统。P系统具有分布式、并行性、可拓展性、非确定性、易于实现等优点。本文针对ABC算法存在
中央全面依法治国工作会议明确了习近平法治思想在全面依法治国工作中的指导地位,这是我国社会主义法治建设进程中具有重大现实意义和深远历史意义的大事。党的十八大以来,习
提高图像分辨率是当前数字图像处理领域的研究热点之一。超分辨率(SR)方法是一组信号处理算法,它允许从同一场景的单个或多个低分辨率(LR)图像生成高分辨率(HR)图像。不久前,深度神经网络(DNN)被引入到计算机视觉、机器翻译、自然语言处理、语音和音频识别、社会网络分析、生物信息学、医学图像分析和材料检验等领域。卷积神经网络(CNN)也被广泛应用于彩色图像和深度图的超分辨率问题,在相同场景的额外HR