微表情数据库建立、检测和识别技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:bossvv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与传统的面部宏表情不同,微表情是无意识的、快速的面部表情,可以在测谎、刑事侦查等应用中提供重要的信息。然而,由于微表情的特殊性,微表情研究存在一些难题。在微表情数据库方面,由于微表情的采集工作较为困难、没有统一的数据库建立标准,因此,用于微表情研究的数据库较少,质量参差不齐。在微表情检测方面,传统的检测技术仅仅基于纹理特征或光流特征,检测的效果并不理想。在微表情识别方面,由于微表情数据库的匮乏,训练集的样本过少,无论是传统方法还是深度方法都受到一定的限制。如何获得可用于微表情识别的丰富信息,减少人工标注工作,是需要进一步研究的课题。
  为了缓解微表情数据库不足,无法满足进一步研究的现状,本文建立了一个专用于微表情检测的SDU_spotting数据库。为了解决人工编码的耗时费力、准确度有限的问题,本文提出了一种基于AU半决策的时频融合微表情检测算法和一种基于无监督跨库的微表情识别算法,并在多个微表情数据库上进行了实验。具体而言,本文的主要贡献如下:
  第一,建立了一个专门用于微表情检测的数据库——SDU_spotting数据库。在现有的微表情检测数据库中,SDU_spotting数据库具有最多的样本数和最高的分辨率。除此之外,SDU_spotting经过科学细致的人工编码,提供了所有样本的AUs、情绪类型以及起始帧、高潮帧和终止帧的信息。
  第二,提出了基于AU半决策的时频融合微表情检测算法。通过半决策算法,使用运动单元信息找到微表情检测的感兴趣区域,并在此基础上,立足时空域和频域两个方面,把提取的光流和频域特征结合,完成微表情检测。在SDU_spotting和CASMEⅡ数据库上的实验表明了算法的有效性。
  第三,提出了基于分布适应的无监督跨库微表情识别算法。与一般的微表情识别模型不同,该算法引入样本信息丰富、和微表情数据具有一定共性的的宏表情作为辅助,使用宏表情和微表情数据库,对另一个没有任何标签的微表情数据库进行识别。算法由源域选择模型和自适应分布对齐模型两部分组成,实现了跨库的无监督微表情识别。在三组跨库数据集上就两种特征进行的广泛实验充分验证了算法的有效性。
其他文献
无叶片风力发电系统通过感应荷电雾化装置将液体介质雾化,在风的作用下,雾化后的带电液滴往电场力的反方向运动,从而增加系统的整体电势能,实现风能到电能的转换。液滴荷电雾化是系统中的关键环节,对液滴荷电机理及电荷转移特性的分析,可为雾化系统参数的优化匹配提供参考,以提高系统总的电势能及能量转换效率。  本文通过理论分析、实验对照等方法对静电场作用下的液滴形态变化规律和表面电荷分布规律进行研究:基于双电层
随着无线通信技术和物联网技术的发展,室内定位的应用需求越来越多。超宽带(Ultra-Wideband,UWB)通信技术凭借其精度高、传输速率高、复杂度低、功耗低、穿透能力强、抗干扰性好等优势,在高精度室内定位领域被广泛使用。室内定位系统的难点包括:多锚点多标签环境中的无冲突通信和定位;定位网络中,节点加入和退出网络等网络管理;多锚点环境中标签定位锚点的实时切换。  针对以上难点,本文基于超宽带通信
该篇论文对添加剂改善微波陶瓷BaNdTiO的介电性能及其机理进行了研究和探讨,微波陶瓷BaNdTiO系统的介电能包括介电常数εr、品质因数Q温度频率系数τf等,这一系统主要具有优良的介电常数εr(80-90),但频率温度系数τf较高(+85ppm/K),需要另加入添加剂来进行调节,以满足实际应用中的需求.该篇论文主要研究利用添加剂PbO和BiO对频率温度系数进行了调节,不同百分比的PbO和BiO添
学位
该论文采用等离子体增强的化学气相沉积(PECVD)生长技术,原位制备了SiO/nc-Si/SiO的纳米结构.实验中我们首次采用等离子体氧化的方法,获得了作为隧穿氧化层超薄SiO层,并利用layer by layer的方法制备了纳米硅层,然后再用等离子体氧化的方法形成栅氧化层.我们通过对基于硅纳米晶粒的MOS结构的电容电压(C-V)测量,研究了硅纳米晶粒的电荷存储现象.
超宽带(Ultra Wide Band,UWB)通信系统可以利用频带极宽的信道来传输信息,与传统窄带通信系统相比具备更高的传输速率,是未来通信行业研究的热点问题,进行准确的信道估计是保障超宽带通信系统可靠性的关键因素。传统的超宽带信道估计方法,在估计精度、频谱利用率上均有待提升,而压缩感知理论通过利用稀疏信号的特性,能够以较高的估计精度完成超宽带信道估计工作。本文旨在通过对压缩感知理论中重构算法的
空间信号的波达方向(Direction of Arrival,DOA)是指利用传感器阵列接收的信源信息,提取出空域信号的角度参数,从而确定信号发出的位置。经过多年的研究,出现了测向性能较好的超分辨测向算法。论文主要对超分辨测向技术关键问题展开深入研究,包括窄带独立信号DOA估计的优化改进、色噪声背景下相干信号测向实现、宽带混合信号DOA估计。论文首先研究窄带信号、相干信号、宽带信号模型,然后对几个
近年来,语音识别深入应用到各种不同的场景,抗噪能力也成为语音识别系统评价指标之一。语音识别系统主要包括声学模型和语言模型两部分,声学模型主要基于DNN-HMM搭建,提取MFCC特征系数作为声学模型的输入,语言模型则使用LSTM网络进行搭建。本文所搭建的强噪声环境下的语音识别系统中,声学模型基于DRSN-HMM搭建而成,得益于DRSN的独特结构,DRSN-HMM具有良好的去噪性能;语言模型基于LST
学位
在深度学习方法快速发展以及海量视觉数据可利用的背景下,计算机视觉领域近年来发展出多种视觉理解方法,旨在辅助机器理解和分析视频及图像的语义信息。图像翻译作为视觉理解的一种常见方法,其关键在于学习到一个可在图像域之间进行变换的映射关系,利用神经网络学习源域内容,然后将其转换到目标图像域空间。人类生产生活中的很多问题都可以转化为图像翻译的子任务,例如在自动驾驶领域,将车载摄像头拍摄的街景图转换为目标分割
学位
人工智能技术的不断发展为智慧监狱的建设提供了很多帮助,给实时监控要求很高的监狱监管部门提供了许多便利。相比于传统的视频监控推荐方案,基于深度学习的智能推荐技术能够在降低监狱管理人员监控视频观看强度的同时为观看人员提供更加合适的监控视频,从而在一定程度上减轻监狱管理人员的工作负担,提高监狱对服刑人员活动监管的效率。目前推荐系统技术主要应用在电子商务领域,技术方案几乎都是根据用户的身份标识和推荐对象的
学位
由于可见光通信(Visible Light Communication,VLC)技术具有频谱资源充裕、功耗低、安全保密性好等优点,近几年来已逐渐发展成为光无线通信领域科研工作者的研究热点。高速亮灭是发光二极管(Light Emitting Diode,LED)的特性,VLC利用其来传输信息,在短距离无线通信中成为射频通信的有力补充。由于商用LED调制带宽有限,导致速率较低,因而在VLC中广泛采用高