基于深度学习的自然环境下面部表情识别算法研究与实现

来源 :华侨大学 | 被引量 : 0次 | 上传用户:pausecn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴于面部表情识别(facial expression recognition,FER)技术在智能人机交互(human-computer interaction,HCI)、市场、教育以及心理学等诸多领域所具有的理论价值或应用价值,近几十年来,其在学术界和工业界受到的关注越来越多。虽然该项技术已取得较多进展,但当其应用于约束较少或无约束的自然环境时,仍易受到头部姿态、环境光照、身份差异以及配准误差等因素的影响。相关研究揭示我们可以通过提升模型对表情图像的表征能力来有效缓解上述影响,虽然卷积神经网络(convolutional neural network,CNN)模型对图像表现出强大的表征能力,但直接用于面部表情识别仍有不足之处,本文的研究目标是以卷积神经网络为基础,探索并设计出具备更强大的表情图像表征能力的模型,以期在自然环境中能更鲁棒、精准的从人脸图像中识别出预先定义的7种基本表情。本文的主要研究内容包括以下两部分:(1)绝大多数用于面部表情识别的卷积神经网络均采用经典的最大池化和平均池化,这些池化策略因仅保留了输入特征的一阶统计信息而限制了模型的表征能力,所以我们结合基线卷积神经网络与二阶池化设计了多种二阶池化卷积神经网络结构,用于捕获输入特征的二阶统计信息。(2)绝大多数用于面部表情识别的卷积神经网络仅包含前馈连接,然而人脑中包含的反馈连接远多于前馈连接,并通过反馈机制表现出强大的视觉注意能力。我们在上述基线卷积神经网络中引入反馈层来构建反馈机制得到一个反馈卷积神经网络,试图模拟人的视觉注意能力,以期能更高效的捕获到分布在人脸各个局部区域内的表情信息。本文涉及的所有模型均在RAF-DB表情数据集上以相同的方式进行实验,实验结果表明不管是二阶池化卷积神经网络还是反馈卷积神经网络,识别性能均优于基线模型。
其他文献
不论是在全球层面还是在国家层面,新自由主义全球化都带来了诸多新的矛盾、社会冲突和全球对抗。新自由主义模式的逐渐自我毁灭迫使人们重新思考苏联的经验;2008年开始的世界
随着互联网以及智能化的快速发展,作为高校重要的一部分,图书管理在促进我国教育发展、营造高校学习环境以及丰富教师和学生知识体系等方面都具有重要的作用。本文以智能化计
巨噬细胞是抵抗胞内菌感染的重要固有免疫细胞之一。根据外部环境和刺激物的不同,巨噬细胞通过极化为不同亚型进一步发挥免疫调节功能。本文就巨噬细胞极化特点以及在胞内菌
数学概率问题与生活实际存在着紧密关系,是研究与解决随机现象的重要科学.概率问题与不等式、函数与统计学等数学知识存在着交汇,通过对数学概率问题的认知与求解,可以考查学
民主改革开始后,西藏社会发生了翻天覆地的变化。藏戏编剧人员根据社会巨变编创出许多反映西藏人民现实生活的新剧目。这些新编剧目与传统剧目相比而言,实现了内容从出世向入
随着环境污染、人们生活方式的转变、性传播疾病的不断增加,不孕症发病率呈逐年上升趋势。世界卫生组织(WHO)预测,21世纪不孕症将成为仅次于肿瘤和心脑血管病的第三大疾病。探讨
设计了可实现分布式并行计算的并行编程语言并行C语言,并且使用模板机制实现了将此并行C语言程序转换为标准C语言程序的转换程序预编译器。并行计算的实现采用了多线程和RPC(
知识产权作为一种无形资产,已成为企业获取竞争优势和创造价值的重要战略资源之一。开放经济背景下,知识产权由传统模式下的法律资产转变为可交易的战略资产。如何通过知识产
公路建设是一项综合性的社会系统工程,与引导和促进物流转换、使用和消耗土地、影响或改变自然风貌等紧密相联;同时路网结构配置与城镇规划的协调、土地资源保护、环境保护等方
泰国广告对于广告界来说是后起之秀,其制作水准之高,传播范围之广,令很多传媒发达国家为之汗颜。在一个并不发达的国家产生了如此优秀的广告片,究其原因有很多方面。优秀的广