基于深度学习的多模态老人情感识别方法研究

来源 :安徽建筑大学 | 被引量 : 0次 | 上传用户:lyzhanhun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了让计算机具有理解、识别、读懂和表达人类情感的能力,情感计算技术开始被深入研究,使得人类与计算机可以实现相互理解、高效互动。可是人类是一个复杂的群体,人类表达情感有着多种载体,包括表情、语音、生理信号、身体姿态等等,通过对多种模态的情感识别研究,可以帮助计算机更好地理解人类,创建更轻松的人机交互环境。本文从建立多模态老年人情感数据库、语音情感特征的提取和识别以及人脸表情特征的提取和情感识别等方面展开研究。其主要研究工作及成果总结如下:1.从情感研究的现状中,可以发现以老年人为对象的情感研究还不够充分,同时国内外研究者们建立的情感数据库中,情感表达对象几乎是年轻人,而且模态单一。针对这个问题,本文在名为《空巢姥爷》的电视连续剧上构建了视频情感数据库、语音情感语料库和人脸表情图像库,并阐述了多模态情感库的构建方法和过程。实验结果表明,构建多模态老人情感数据库是合理的和有效的。2.在自建的多模态情感数据库的基础上,采用自编码神经网络进行特征降维,并选择支持向量机作为分类器,进行语音情感识别研究。本文分别提取傅里叶系数特征(Fourier parameter,FP)、动态特征(一阶差分和二阶差分)以及全局特征(最大值、最小值、平均值、中值和方差)共计1800个特征参数。然后采用自编码神经网络对特征进行降维,将降维后的特征参数送至分类器进行情感识别。实验结果表明,降至800维特征的情感识别率最高。3.在空巢姥爷的人脸表情图像库中,本文提出以卷积神经网络为模型的老年人人脸表情识别方法,避免了对图像进行复杂的特征提取。在空巢姥爷人脸图像库上,对输入的人脸表情图像进行卷积操作,然后利用卷积神经网络模型中的池化层来降低特征维数,最后,本文采用Softmax分类器选取输出值最大的神经元所对应的类别作为分类结果。通过与多决策神经网络和自编码神经网络比较,实验结果表明,将卷积神经网络模型运用在空巢姥爷图像库上的表情识别率较好。
其他文献
从马克思主义理论自身发展的视角来看,中国化、时代化、大众化分别是马克思主义理论发展的三"维",即空间维度、时间维度、主体维度,"马克思主义"理论是一体,即中国化、时代化
随着经济体制的不断改革发展,税收筹划直接影响到企业的生存与发展,而税收筹划作为财务管理中的核心管理内容,结合国家相关的税收优惠政策,通过科学合理的管理方案,制定巧妙
本文通过对保险会计准则出台的依据、特点及新保险会计准则存在的问题,以及如何科学有效地实施新保险会计准则机制等几个问题进行了探讨。笔者在自己多年的实践中,总结了一些
本文在商业模式冰山理论的基础上提出商业模式SECI模型。围绕内外部环境、价值主张、价值网络及价值体现四个方面,将商业模式定义为通过用户的价值增值反馈来使企业价值不断
莎士比亚文艺美学思想的底蕴──“举镜子反映自然”说辨伪肖锦龙把握一艺术家的文艺美学观是理解其艺术创造、打开其艺术殿堂的关键。莎士比亚关于艺术的看法集中地反映在哈
德里达的"自然/文化对立"意味着真正的自然处于一种无法表述的状态。解构将我们的关注引向能指的"不能",引向"文化"对自然的抹煞;但舍弃"文化",我们也不能进入自然。因此,我
就目前中等医学教育文化基础课教学现状和存在的问题作分析,提出解决的途径与对策。
以短枝"富士"苹果为试材,研究了叶面喷施不同体积分数的沼液对苹果产量品质及成熟过程中蔗糖代谢相关酶活性的影响。结果表明:喷施体积分数为75%的沼液,增加了果实维生素C、
<正>《台阶》是人教版八年级上册第二单元的一篇小说。文章写了一个老实厚道、毫无经济基础的父亲,却非常羡慕人家高高的台阶,于是花了大半辈子的心血造起了有九级台阶的新屋
<正>生命化教育对于小学生来说,具有重大的启蒙和奠基意义,能够贯穿人的一生。我对生命化教育的基本含义及其与小学语文教学之间的联系进行分析,并以苏教版小学语文教材为例