基于双时间尺度卷积神经网络的微表情识别

来源 :西南大学 | 被引量 : 0次 | 上传用户:intaaab
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类面部表情在人们的日常生活、交流中扮演着十分重要的角色。通常,我们所指的人类面部表情被称之为“宏表情”,其持续时间一般在0.5s~4s之间,容易被人察觉和辨别。然而,有心理学研究表明,“宏表情”在表达人类真实情感上具有一定的掩饰性,即面部“宏表情”能够掩饰真实情感的流露,而与“宏表情”相对的“微表情”,由于其能够表达人类试图压抑的情感,近年来受到了人们的广泛关注。微表情是一种不受人控制的、简短的面部表情,它能够反映人试图掩饰的情感以及人未意识到的情感体验,因此通过“微表情”来识别人类的情感显得更加真实、可靠。遗憾的是,由于“微表情”具有持续时间短(1/25s~1/5s),活动幅度、区域小等特点,不仅人难以识别,并且在利用模式识别等方法对微表情视频片段进行分类识别时,很难有效的表征不同微表情所具有的特征信息;除此之外,由于自发微表情数据库难以采集,数据量缺乏等要因素,使得训练一个有效的微表情识别算法也变得十分艰难。针对以上问题,本文提出了一种利用双时间尺度卷积神经网络(DTSCNN)对微表情进行识别的方法。该方法首先对微表情数据集(CASMEI、CASMEII)进行扩充处理,以此降低网络训练过程中过拟合的风险,然后利用双通道卷积神经网络分别对微表情视频序列在64fps和128fps两个时间尺度进行特征提取,最后对所提取的特征采用SVM进行决策级融合分类。DTSCNN不仅解决了由于微表情数据库样本少、难以训练的问题,而且在CASMEI、CASMEII数据库上验证的结果显示其识别率(66.67%)比最新的、传统的微表情识别算法(MDMO:55.45%、FDM:56.97%、STCLQP:56.36%)的识别率提高了10%以上。
其他文献
脉冲多普勒探测系统发射受脉冲调制的高频振荡信号,来探测目标(或其环境)信息,对获取的信息(其中混杂各种干扰信号和无用的信息)进行实时信号处理,提取主要的和有用的信息,如
本文主要研究了认知无线局域网环境中的网络资源管理架构和无线资源管理策略选择机制。首先介绍了认知无线网络的相关概念、发展现状以及IEEE1900.4标准的资源管理架构和基于
微博已经成为当今社会新一代的重要媒体,几乎现实社会中的事件都会在微博中形成讨论,并进一步酝酿发酵,进而影响到现实中的社会事件。因此对微博网络中话题的产生发展及影响
十九世纪后期,Hopfield和Tank提出利用人工神经网络解决优化问题,为人工神经网络的探索进程开辟了新的研究途径。自此之后,神经网络优化问题的研究及其应用成为热点。现如今
随着社会的发展,目标检测与跟踪技术在视频监控领域得到了越来越多的应用,然而,在传统的目标检测与跟踪算法中,研究人员往往更注重算法的有效性,而弱化了对算法实时性的考虑,
随着高速铁路的发展和人们对宽带无线通信需求的增加,如何为高铁列车旅客提供可靠稳定的宽带无线通信服务,是高速铁路无线通信亟待解决的问题。和典型低速移动环境相比,在高
正交频分复用是一种减轻频率选择性衰落的技术。单载波频分多址利用单载波调制、傅里叶预编码的正交频分复用和频域均衡,能够获得和正交频分多址相似的复杂度和性能,并且由于继
人类的大脑是一个十分复杂的系统,它具有组织神经元进行信息处理的能力,并以比数字计算机更快地速度对信息进行并行以及非线性的处理。一直以来,建立具有人类智慧的机器或自
摘要:视频的应用越来越广泛,如何保证视频质量也是讨论的越来越多的问题。对视频编解码器进行测试是保证视频质量的一个重要方面。然而视频编解码器的测试与通常的软件测试存
目前,针对GSM-R系统这种特殊传播环境的干扰分析,还处在一个相对较初步的阶段。或者说,这种特殊场景下的干扰分析,被大家当作一个特殊情况,还没有引起足够的重视。但是,其他