Deep Learning Based Speech Emotion Recognition by Fusing Acoustic Features and Transcriptions Clues

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:yangpingliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
其他文献
近年来,人脸表情识别逐渐成为计算机视觉领域中一个重要的研究课题。无论在人与人交流中还是在人机交互的过程中,人脸表情都起到了非常关键的作用。本文主要的研究内容分为两个方面,分别是视频中的人脸检测以及基于卷积神经网络的人脸表情识别。具体的研究工作如下:本文首先针对人脸检测的问题提出了一种混合的检测算法。首先采用肤色分割排除复杂背景及光源的影响,然后将上一步得到的人脸候选区域作为AdaBoost的输入子
学位
随着人工智能技术的发展和不断提高以及教育质量的提高,越来越多的人工智能工作者和教育者正在使用技术为教育服务,使教育尽可能自动化和智能化,并尽最大努力结合人工智能和教育。随着人工智能2.0和大数据的出现,智能辅导系统也得到了显着发展,它可以模拟教育者的教学任务,并设计适当的教学策略来帮助学生获得新知识和解决问题。自动解答是智能辅导系统的重要组成部分,它为中小学的教育提供了关键的技术支持。物理电路题的
学位
深度学习不断发展,因为其比传统算法有很多优势,所以许多传统算法被深度学习算法取代,使得工作效率得到进一步提高。但还有很多实际的应用存在各种各样的的问题,需要被我们解决。OCR中的一些问题就需要我们去研究解决,本课题是对不同的文本检测与识别技术进行研究,OCR技术属于模式识别范畴,在版面分析、字符切分以及提取等各个方面都有深入的研究,现如今,一个字符识别准确率已经比较不错。初中物理试题中多包含汉字、
学位
随着信息化的到来,人们变得越来越依赖互联网获取所需要的信息。但是随着互联网的发展,其上的信息呈现爆炸式增长,如何有效地从海量信息中筛选出所需的有用信息成了关键性的技术问题。自动文本摘要技术可以帮助用户从海量信息中检索出所需的相关信息,避免通过搜索引擎来检索可能产生过多冗余片面信息的问题,有效的解决了信息过载问题。目前,自动摘要方法大体上可分为两类:抽取式和生成式。抽取式的基本做法是从原文中抽取部分
学位
由于采集环境的影响,例如,在阴天,夜晚以及物体被遮挡等低照度条件下,由采集设备获得的图像往往对比度低,噪声多,细节信息丢失严重。移动设备捕捉到的图像往往不能满足人们的视觉效果,同时也给计算机识别技术带来了巨大挑战。随着科技的进步和多媒体技术的发展,对图像质量的要求也越来越高。对低光照图像进行图像处理也渐渐成为数字图像处理领域亟需解决的问题。图像处理蓬勃发展,广泛应用于视频监控、智能交通、医学成像、
学位
期刊
期刊
人脸表情是情绪表现的重要途径,表情的变化可以传递丰富的情感信息。对表情进行识别是理解人类情感的基础,是实现智能人机交互的先决条件。在计算机视觉研究领域,表情识别作为分析人类情感的重要一环,一直被广泛关注。计算机只有读懂人类的表情,才能理解人类的情绪,从而进一步与人类进行自然的交流。随着深度学习技术近年来的快速发展和广泛应用,表情识别研究也因此取得了长足进步。目前,大多数表情识别方法,对六类基本表情
学位
期刊
期刊