融合人脸表情和语音的双模态情感识别研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:ljxue1224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的人机交互过程一般通过鼠标、键盘等方式进行,这种只基于逻辑的方式无法使机器理解和适应人的情感。为计算机加入情感识别功能,可使其像人一样去理解各种情感特征并作出相应的反馈,使得人机交互过程更加友好、自然,以达到更好的用户体验,因此,情感识别近年来备受研究者的关注。情感是人际通信交流的重要手段,在交流互动的过程中获取对方的情感信息并进行分析,有助于更好地理解对方,可以使沟通更顺利、有效地进行。人在交流过程中,其语音、表情和姿势都是沟通内容的一部分,都包含着情感信息,研究者们对人脸表情识别、语音情感识别等单模态情感识别进行了广泛研究。单模态情感识别采用的情感特征信息比较单一,在情感识别中有一定的局限性,本文在分析和总结现有理论和研究的基础上,提出了融合人脸表情和语音的双模态情感识别的研究。本文的主要工作包括以下三个方面:(1)基于图像的人脸表情识别本文同时采用彩色和深度人脸表情图像来获得更多的人脸表情信息,并根据面部点的位置关系进行粗略的面部姿势的评估。对人脸表情图像进行预处理,并对彩色图像用Gabor小波进行特征提取,对深度图像用深度值统计分布的方法进行特征提取,将两者特征联合在一起作为识别时用的特征并用PCA方法对特征进行降维。最后,使用SVM实现表情训练和分类。实验结果验证本文提出的方法在人脸表情识别中取得了较好的效果。(2)基于隐马尔可夫模型的语音情感识别本文对语音信号进行预处理,包括预加重、分帧、和加窗处理,然后对其提取特征,在声学参数中选取语速、基频、能量、和MFCC、共振峰,并将这些参数的联合特征作于语音的情感特征。最后,使用HMM模型进行训练情感识别。实验表明,本文提出的方法在语音情感识别中取得了较好的结果。(3)融合人脸表情和语音的双模态情感识别本文采用决策层融合的方法,将人脸表情识别和语音情感识别进行融合,分别根据求和规则和求积规则进行双模态情感识别实验,结果表明本文提出的方法明显地提高了识别性能。
其他文献
互联网时代极大地改变了人们的生活方式。随着信息技术的快速普及与发展,各类互联网服务,无论是电子商务平台、社交网站抑或是在线视频网站,都在运营中产生了海量的数据。如
多分类器联合,又称多分类器组合、多分类器集成,在模式识别研究中,该技术可以显著地提高模式识别的性能,受到研究人员的极大关注。研究人员已经提出了很多分类器集成方法,且
近年来,随着因特网的崛起和多媒体技术的发展,VoIP已经占有相当比重的市场份额,成为当今电信业和计算机业最热门的话题之一。SIP协议以其灵活性、简单性和可扩展性成为VoIP技
随着无线传感器网络技术的不断发展,其应用日益广泛,桥梁监控便是其重要应用领域之一。桥梁监控中数据采集技术已经成为国内外研究的热点与难点,针对桥梁监控中数据采集的迫切需
随着因特网的迅猛发展,电子邮件成为了现代通信的主要手段。但是同时许多垃圾邮件也在网络中蔓延,给广大用户带来了大量的麻烦。因此能够有效地防治垃圾邮件是一个有重要意义
中国石油勘探与生产分公司对信息化的建设非常重视,业务部门开发了很多专业应用系统,但是这些应用系统有些是独立开发的,专业应用系统之间不能共享数据,用户提出了对专业应用系统
随着计算机网络技术的飞速发展,数字多媒体的存储、复制与传播变得非常方便,如何在网络环境下实施有效的版权保护,已引起国际学术界、企业界和政府的高度关注。本文在比较全
随着网络延伸到生活中的各个角落,有眼光的学者和企业都发现了网络中的节点所蕴藏的巨大计算潜力,于是基于广域网的分布式应用逐渐成为研究热点,P2P软件的兴起有力的证明了这
本文的目标是设计和研究一个快速开发平台,可以使开发人员以此为基础进行J2EE项目软件的开发。平台实现了MVC设计模式,解决了开发缓慢、难以维护、难以积累等问题,尽力做到大
商品销售是一个高度复杂的非线性动态系统,其变化规律即有一定的自身的趋势性,又受政治的、经济的、心理的诸多因素的影响。建立在数理统计基础上的传统定量预测方法在对销售