基于卷积网络集成的面部表情识别方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:snowin11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动表情识别Automated Facial Expression Recognition,缩写FER)赋予计算机感知并尝试理解人类情感的能力。在计算机视觉、人机交互和情感计算领域都有着非常重大的研究和应用价值。如果机器能够像人类一样拥有感情的话,那么人类与机器的关系将会被彻底改变,机器对于我们人类而言将不再只是一种工具而已。表情因其独特的心理属性,对于计算机而言存在一定的分析和理解障碍。本质上表情是人类内心复杂情感的外在流露,而这些深藏于内的抽象感情难以被计算机量化表达。所以对于我们而言,表情识别也并不应仅仅归于一种的图像分类问题而已。受益于近几年来深度神经网络模型的快速发展,特别是卷积网络在图像检测和识别方面取得的突破成果,在本文中我们设计和实现了一种基于卷积网络集成的模型来尝试解决表情识别问题。我们的集成卷积网络模型包含两个阶段:第一阶段,训练多个结构不同的卷积子网络模型。每个子网络模型包含着个数不同的卷积层,每个卷积层后连接着非线性激活层和池化采样层。这些卷积子网络模型在训练集上分别训练至收敛。第二阶段,由这些训练好的子网络模型连接在一起构成最终的模型。各个子网络模型通过移除输出层,并把倒数第二层的输出结果连接在一起后再输出到若干全连接层中,通过这样的方式使这些单独训练的子网络模型连接成一个整体。通过不同卷积子网络集成的方式,我们充分发挥了不同结构子模型分类的优势,各个子模型在协同工作中能够发挥互相补充的效果。整个模型输入一张面部表情图片,输出七种基本表情中的一种,包含愤怒、恶心、害怕、高兴、伤心、吃惊以及中立表情。我们在FER20131数据集上训练和测试了整个模型,实验结果显示我们提出的集成网络模型取得65.03%的正确率,非常接近于人眼在此数据集上的识别水平(65±5%),且比单个子模型最多有近4%的准确度提升。
其他文献
软件测试是软件开发过程中控制软件质量必不可少的一种手段,随着新的开发语言和应用平台的不断出现,软件质量和可靠性保证面临着新的挑战。目前,针对面向对象软件的各种测试
早在公元前,利用脉象诊断人体疾病的脉诊就已经在许多传统医学中得到了详细的描述和记载,如中国医学(2500BC)、印度Ayurveda医学(1600BC)等等,并且有着广泛的应用。  然而,由于
唇读、唇动技术作为一种新兴的智能人机交互技术,近年来正逐渐走向实用化。对唇动技术的研究,主要集中在唇动身份识别和说话人内容识别(即,唇读)两大应用上。本文主要致力于
对于基于Web的工业监控应用来说,嵌入式浏览器是一个重要的环节,尤其是在数控领域。随着嵌入式系统和计算机网络技术的快速发展,应用于数控领域的嵌入式浏览器技术也必须不断
近年来,随着Internet的迅速发展和应用需求的日益增长,人们面临着无处不在的海量信息资源,却无法获得需要的有效资源。于是,网格计算的概念也就就应运而生了。网格构建在现有
在进入信息时代的当今社会,人们被各种各样的信息所包围,股票行情、公司管理、客户关系、天气预报、体育新闻…,信息的即时获取是信息综合开发和利用的一项重要工作。信息的
近年来,由于人类生存环境的恶化,肺癌等肺部疾病已经成为导致人类死亡、影响人类生活质量的主要原因之一。对于肺癌病人来说,早期检测可以使病人及时进行治疗,产生良好的预后
在“文景转换”系统中,要针对输入文本生成相应的三维动画,就必须首先运用自然语言处理技术,全面地理解文章中的场景信息。为此,我们提出了面向“文景转换”系统的场景识别的
近年来,随着统计机器学习技术的不断发展,对句子进行语义分析逐渐受到重视起来。语义角色标注(Semantic Role Labeling, SRL)是浅层语义分析的一种可行方案,并具有广阔的应用
随着互联网的迅速普及,它已经成为我们生活中不可或缺的一部分,在它带给我们极大便利的同时,网络安全也越来越受到人们的关注。即时通讯,作为网络的一个重要分支,也自然成为