基于图像序列的表情识别研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:imanhuaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情识别就是给定一些表情图像或图像序列训练样本,通过这些样本去预测任意未知图像或图像序列的表情类别。按照研究对象的划分,表情识别可以分成基于静态表情和基于序列表情两种。基于静态表情的研究在过去几十年里得到了长足的发展,有着计算量小,特征提取简单方便等优点,在某些场合下也取得很好的识别效果,但静态表情忽略了表情具有动态属性这一事实,而且其特征提取虽然简单但容易受到外界环境和个体差异的干扰,鲁棒性不强。随着研究的进一步深入,越来越多的科研人员开始着手序列表情的研究,因为它抓住了表情有一个产生到消失的过程,所提取的序列表情特征不仅包含面部信息还附加了时间关联性,因此识别率能达到更高的水平,同时基于序列表情的研究也更符合实际。在本文中,围绕着CK+和Oulu-CASIA两种序列表情图像数据库展开研究,具体工作和主要内容如下:(1)给出序列表情识别包含的详细算法,包括人脸检测与定位、图像预处理、特征提取、识别分类。本文通过Viola-Jones人脸检测和基于Caffe的人脸检测定位和裁剪出人脸来。为了消除光照不均、图像尺寸不一等外界干扰因素对表情识别结果的影响,又用图像灰度化、直方图均衡化等预处理技术对序列图片进行了处理。(2)提出了一种基于特征点追踪和变状态条件随机场的人脸表情识别方法,在CK+数据库上取得了很好的效果。特征点追踪部分用了主动外观模型,针对传统主动外观模型回归拟合算法拟合速度过慢造成实时性差的问题,提出了一种线性回归并行增量级联拟合策略,在LFPW数据库上测试结果表明,提出的拟合算法较线性回归算法在精度和速度上均有提升。然后用变潜在条件随机场做特征分类,潜在条件随机场虽然用潜在状态能很好的编码人脸表情或AU这样的面部动态特征,但存在潜在状态模式固定的问题,比如检测表情序列各个部分某AU处于激活与否,使用有序潜在状态能更好地描述包含该AU激活的段,但无序潜在状态能更好地描述未出现该AU的段,而潜在条件随机场把所有潜在状态都固定为有序或无序,针对此,提出了 一种变状态条件随机场模型,其能够根据输入数据自动选择最佳的潜在状态,用CK+数据库327个图像序列进行测试,结果在已标定特征点位置的CK+数据库上的识别率达到95.8%,在未标定特征点位置的CK+数据库上的识别率达到95.0%,并与其它特征提取方法和分类方法相对比,结果证明了本章算法的有效性。(3)深度学习时期将表情识别的两个核心的步骤:表情的特征提取和分类合并,提出深度学习模型,该模型能自动地学习表情相关的特征并分类,取得了显著的识别效果。本文提出了一种卷积神经网络和循环神经网络的融合模型。该网络模型主要包含两个部分:空间特征提取网络,时序信息提取网络。对于给定一个表情图像序列,空间特征提取网络从序列每幅图像中提取表情的空间特征。然后用长短期记忆网络处理、统计序列的时序信息,主要是获取特征在序列中时间上下文信息,最后对这些整合了时序信息的特征分类。为了使提出的深度学习模型得到充分的训练,用角度变换的方式将数据库扩充14倍,最后在扩充后的CK+、Oulu-CASIA数据库上进性测试并和一些算法对比。测试结果表明,融合的网络模型可以有效地提取表情的空间特征和时序信息,在CK+数据库上达到了 96.4%的准确率,较上一章提出的条件随机场的前深度学习算法有提升,也比一些算法比如TMS(96.1%)、3D-CNN(92.39%)更有效,并在Oulu-CASIA数据库上也达到了 91.5%的准确率,证明了算法的有效性。
其他文献
在自由空间光通信(Free Space Optics Communication,FSOC)中,信号光在通信过程中不可避免会受到大气湍流的影响,使得信号光波前发生畸变。为了提高FSOC系统的通信质量,自适
目前,中国的警用移动通信网络主要包括窄带的警用数字集群(Police Digital Trunking,PDT)和宽带集群通信(Broadband Trunking Communication,B-Trun C)两种。随着智能终端的
有机光电探测器(Organic photodetectors,OPDs)具有诸多优点,如成本低、吸收系数大、可大面积制备、活性层材料来源广泛等,因此在光电探测领域展现出很好的应用前景,其中倍增
现在,人们已经进入到一个多模态社会。教材作为一种重要的教学媒介,也呈现出了多模态特征。文字已不是知识的唯一呈现方式,其他符号资源正在影响着教材的形式和功能,比如:图
由嵌段共聚物自组装形成的介观晶体,其结构单元为大分子基团,基团之间的相互作用远小于硬物质中的分子间相互作用,因此是典型的软物质体系。软物质体系中,熵对自由能的贡献不
随着信息化战争态势的持续演变,雷达一方面扮演着重要角色,一方面面临着生存问题,生存即必须有效应对面向雷达的导弹打击和电磁干扰。雷达干扰的方式主要有旁瓣干扰和主瓣干
近年来,无线通信技术不断发展,给人们的工作生活带来了极大的便利。但由于无线信道的开放性,信息在传输过程中易受到非法用户的窃听及干扰。通常,信息安全是通过高层加密体制
轨道角动量(Orbital Angular Momentum,OAM)复用技术为自由空间光通信提供了新的复用形式,可用于提高通信系统的信道容量。研究携带OAM的涡旋光束的产生及传输属于OAM复用通
目前,糖尿病患者主要采用第2代手持式血糖仪进行个人检测,II型糖尿病人每天至少需要检测2次,I型糖尿病人每天需要检测4次来判断血糖的波动趋势。这种方式相对简便、廉价,但无
“日盲”紫外光(波长200 nm~280 nm)具有非直视、全天候等传输特点,适用于无人机隐秘通信。然而,由于复杂的大气环境,紫外光在空中传输会受到不同形态和分布的气溶胶粒子的散