基于小尺度核卷积的人脸表情识别研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wu000mengya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情作为一种传达情绪状态和意图的主要形式,在人际关系中提供了重要的非语言交际线索。随着人工智能和机器学习等技术的兴起,现有的人机交互方式已经无法满足人类的需求,使机器具备精确辨别人类情绪的能力逐渐成为计算机视觉等领域的热点研究问题。受光照、角度等客观条件影响,人脸面部表情难以达到特征统一,给计算机识别情绪带来了巨大挑战,因此,构建具有准确表情分类能力、学习不同表情特征的机器模型对实现自然人机交互具有重要研究意义。随着深度学习方法在计算机视觉领域的广泛应用,使现有的面部表情识别模型效果得到了显著提高,但仍存在网络泛化能力不强、模型结构复杂导致网络计算量大、表情识别效果不够理想等问题,针对这些问题,本文提出一种基于小尺度核卷积的人脸表情识别方法,通过设计多层小尺度核卷积块提取面部表情特征,对样本数据进行训练测试优化特征提取网络模型,使用Softmax分类器实现表情分类,并对方法性能进行实验验证,证明算法的有效性。本文的研究工作主要包括以下几个方面:1)采用数据增强变换等方法来增强网络模型的泛化能力,降低人脸表情图像的多样化影响,在图像预处理阶段采用人脸检测和数据增强两种手段,扩充样本数据,测试阶段使用数据增强变换增加模型鲁棒性。2)为有效提取表情特征,同时降低算法复杂度,设计小尺度核卷积块结构,采用多层小尺度核卷积代替大卷积作用,确保获取足够感受野大小的同时减少模型网络参数。网络在输出分类前利用一层完全连接层进行特征信息整合,保证算法简洁性。3)构建一种基于小尺度核卷积的人脸表情识别模型,通过多层小尺度核卷积块和下采样网络结构迭代学习图像表情特征,应用批标准化以及Leaky-ReLU激活函数,提高模型非线性能力,全连接层中加入Dropout方法来降低过拟合影响,用Softmax分类器实现七种表情分类,引入交叉熵损失函数通过反向传播优化模型表情特征提取能力,实现目标人脸图像表情的准确识别。本文采用FER2013和CK+两种公开数据集进行实验,实验结果表明本文设计的人脸表情识别方法能够有效识别面部表情,降低算法复杂度,提高表情识别准确率。
其他文献
信息抽取(Information Extraction)技术是指从非结构化数据当中提取用户感兴趣的信息,形成结构化的存储或提供即时检索功能的技术。最近几年来随着深度学习技术的快速发展,信
信息搜索方法的作用是在信息系统里快速准确地查找到用户需要和关心的信息数据,提升搜索的效率和质量。近年来互联网(Internet)技术的高速发展带动着信息系统的数据处理能力
电磁波、光波的奇异调控实现和应用带来了科技上的重大突破,相应的奇异操控在其他波领域(如声波)的研究也成为热点。然而由于弹性波调控存在材料和模态转换等问题,利用传统方
南昌城市化进程加快,有力地带动了园林绿化的发展。近些年,南昌市引进了多种园林绿化植物,迅速改变了以往的植物群落结构,导致市内生态小环境突然改变,病虫害发生率迅速上升。加上园林绿化植物的养护管理缺位、气候变化大、栽培方式落后,病虫害问题愈加猖獗。为全面分析南昌园林绿化植物的病虫害问题,包括病虫害种类、发生规律、植物危害程度等,进而提出有利于提高病虫害防治力度的策略,间接优化市内生产生活环境,提升城市
Bézier方法和B样条方法在传统几何造型中具有非常重要的地位,为现代工业提供了灵活的曲线曲面设计技术。近年来,随着几何工业的发展,传统的Bézier方法和B样条方法已难以满
停车事件检测是高速公路监控系统的重要组成部分。与其他停车事件检测算法相比,基于Haar-like+Adaboost的目标检测算法具有目标分类能力较好、所需图像样本较少,且特征训练不
视觉SLAM已广泛应用在仓储物流、AR/VR、无人机、自动驾驶等领域,目前已有的视觉SLAM方法多是假设物体静止,或是将场景中的动态特征当作异常值剔除。本文针对实际环境中动态
随着大数据时代的到来,云存储很好的解决了数据存储与共享问题,但存储在云中的数据频繁遭到黑客攻击,泄露数据的机密性与隐私性.为此,可搜索加密概念的提出实现了在不解密密
随着互联网信息时代的发展以及电脑和手机的普及,人们可以随时随地把生活或者娱乐图像上传到网络中,导致图像呈现出爆炸式增长。因此,如何从大量图像中准确筛选出目标图像已
随着市场竞争逐步加剧,现代企业所处的市场环境发生了深刻的变革,企业竞争越来越强调基于客户需求的竞争,为适应市场需求,满足客户的个性化定制,半导体等制造业中大都采用多