基于语音、表情与姿态的多模态情感识别算法实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:prajana
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人类的社交活动以及日常交流过程中,语音、姿态和面部表情被认为是传达人类情感的主要渠道。近年来,人类情感识别领域的相关研究取得了长足的发展与进步,为人工智能在今后的普及奠定了坚实的理论基础。起初人们对人类情感识别的研究还仅仅停留在单模态的情感识别上,然而,近几年来,随着科学技术尤其是人工智能技术的不断发展,越来越多的研究人员将目光放在了基于多模态相互融合的情感识别研究上来。文中提出了一种基于语音、表情与姿态的三模态情感自动识别方法。本文的研究工作主要有:(1)各模态情感特征的提取。首先,对于语音信号,提取得到它的韵律特征和MFCC特征等情感特征;对于表情信号,利用Gabor小波变换提取得到它的Gabor特征,并利用主成分分析方法对其进行特征降维以去除冗余信息,同时使其更易于处理;对于姿态信号,则利用EyesWeb平台提取得到描述姿态情感特征的各种参数来组成姿态情感特征。(2)情感特征的融合。对提取得到的各模态的情感特征进行归一化,并利用判别多重典型相关分析(Discriminative Multiple Canonical Correlation Analysis,DMCCA)将三个模态的情感特征融合起来,接着利用特征选择算法ReliefF对融合后的情感特征进行特征选择以进一步去除那些对类别判定不利的特征。经过融合后的特征不仅更便于处理而且综合利用了三个模态的情感信息,更加利于情感类别的准确判定。(3)三模态情感识别。在得到融合后的情感特征后,利用训练样本的情感特征对基于支持向量机的分类器进行训练得到一个预测模型,并利用训练得到的预测模型对测试样本进行情感类别标签的判定。仿真实验表明,在利用多模态情感信息的情况下有着较单模态更好的识别率,达到了50.43%,证明了DMCCA算法的有效性。
其他文献
随着视频事件描述的发展,基于文本的描述方式与基于内容的描述方式由于其存在的缺陷,已经不再适用于描述交通监控视频中发生的事件。本文的研究内容是交通视频中事件的描述与
低密度校验码(LDPC)是一种优秀的信道编码方案。MIMO技术极大的提高了频谱利用率,在时域、频域、码域之外,实现了对空间域的利用,为无线通信系统容量的进一步提升提供了新的
随着无线局域网的迅猛发展,无线网络规模和覆盖范围不断扩大,集中式无线网络架构已经逐步取代了原有的自治式网络架构。伴随着网络架构的成熟和升级,集中式无线局域网接入点控制
在OFDMA系统中运用MIMO技术,虽然能够实现高速率大容量的传输,也可以很好的改善系统的可靠性,但是由于接收信号是多根发射天线的信号叠加,不同天线之间的信号会存在干扰,并且空时
多天线技术可以在不增加额外功率和带宽的前提下极大的提高系统容量和频谱效率,正交频分复用(OFDM)技术则具有抗多径衰落和频谱效率高等优势,二者已成为3GPP长期演进计划(LTE)
无速度传感器矢量控制(SVC)由于省去速度传感器,取消了相关的编码盘连线,降低了系统的维护成本,提高了系统可靠性,故该技术近年来得到广泛关注。该技术的核心便是如何快速准确地估算电机转速信号。目前应用较多的转速辨识方法普遍存在低速或接近于零速时性能较差、负载及电机参数扰动时动态性能不理想等缺点,因此,对高精度速度估计器及相应的电机参数辨识器的研究就成为了热点。在此背景下,针对现有方案的不足,本文以感
IDS(Intrusion Detection Systems)旨在检测网络入侵行为,当前的IDS普遍存在以下问题:1)洪流报警:普通的IDS每天几乎能产生数百甚至上千的报警,报警中的大部分都是误报警(fal
认知无线电技术对授权频谱的不干扰“二次利用”可以有效的缓解频谱资源短缺的问题。频谱感知作为认知无线电网络的关键技术,其感知性能的好坏,直接影响认知无线电系统的整体
随着我国经济和社会的发展,平面定位系统在多种领域的运用日趋广泛。传统的平面定位系统由于其体积较大、重量较重的原因,一直成为限制其发展的症结。近年来,基于微型惯性测量组
随着无线通信技术的迅猛发展,频谱资源的紧缺已成为一个不容忽视的问题。1992年,“认知无线电”作为一个崭新的概念登上无线通信领域的舞台,成为频谱资源优化配置方面一支新