【摘 要】
:
随着人工智能技术的普及,诸如医疗诊断、社交机器人、疲劳驾驶检测等人机交互系统开始被逐渐应用于现实生活,以此来满足当前社会的各种需求。这些应用大多涉及到生物体识别技术,而人脸的面部表情往往被认为是表达人类情绪的重要方式之一,因此被广泛采用于生物体识别这一领域。让机器准确地识别人脸表情,对人类内在情绪进行感知分析,这对于人机交互系统以及强人工智能方向的发展有着十分重要的意义。然而,人脸表情由于其变化特
论文部分内容阅读
随着人工智能技术的普及,诸如医疗诊断、社交机器人、疲劳驾驶检测等人机交互系统开始被逐渐应用于现实生活,以此来满足当前社会的各种需求。这些应用大多涉及到生物体识别技术,而人脸的面部表情往往被认为是表达人类情绪的重要方式之一,因此被广泛采用于生物体识别这一领域。让机器准确地识别人脸表情,对人类内在情绪进行感知分析,这对于人机交互系统以及强人工智能方向的发展有着十分重要的意义。然而,人脸表情由于其变化特征较为细微,经常会受外貌特征的干扰导致无法被有效地识别。同时,日益复杂的神经网络模型产生了繁重的资源消耗,给小型、移动设备的部署带来了一定压力。对于这两个问题,本文基于生成对抗网络及模型压缩技术,深入研究如何利用轻量级的生成对抗网络实现更加精准的人脸表情识别。本文主要工作如下:1.针对传统卷积神经网络无法提取较为纯净的人脸表情的问题,本文提出了一种可实现表情、外貌特征分离的生成对抗网络模型。生成器拥有两个编码器和一个解码器,编码器的目的在于分别提取外貌和表情特征,解码器旨在重构出人脸图片;判别器则是对于生成器的输出进行判断,以此来指导生成器的重构过程。通过设计真假及相似性判断的损失函数,生成器与判别器之间将进行对抗训练,从而生成逼真的中性脸和有表情人脸图片,以表明表情和外貌特征在生成器的中间层中得到了较好的学习。在识别阶段,对于待测人脸图片,只需将其输入至生成器的表情编码器中,即可提取纯净的表情特征,并将该特征直接进行表情分类。实验结果显示,与当前先进的表情识别算法相比,本文所提算法在精准度上取得了一定的提升,且改善了在不同数据集上的普适性与鲁棒性。2.针对生成对抗网络的轻量化问题,人工设置子网络结构的方式往往无法寻找到最优解,而神经结构搜索算法又会消耗太多的计算资源,因此我们使用网络修身算法来进行子网络的搭建。网络修身要求在网络训练过程中,对批标准化层的缩放因子进行正则化约束,并通过设置缩放因子的阈值进行网络通道的裁剪,这种算法可以在得到精简网络的同时减少时间的消耗。之后,对于裁剪出的子网络,本文提出一种基于教师判别器的辅助损失,并与传统特征层之间的感知损失相结合,以知识蒸馏的方式对于子网络进行微调,提升了模型的稳定性。实验表明,该轻量化设计对原始网络进行了大幅度的压缩,同时也维持了有效的表情识别性能。
其他文献
随着数字存储技术的发展和可穿戴设备的流行,第一视角视频数量日益增多,广泛的第一视角视频相关应用开始普及。视频摘要与视频描述作为第一视角视频理解的重要方向,在危险行为监测、行为记录与行为分析等领域有着可观的应用前景。由于可穿戴设备的长期佩戴特性,如何智能化提取第一视角长视频的视频摘要并生成方便阅读的文字描述成为了急需解决的问题,并受到了大量研究者的关注。本文研究基于第一视角的视频摘要与视频描述算法,
在企业管理过程中如何发挥人的作用,一直是管理者和研究者关心的问题。随着我国近年来城镇化、信息化的快速发展,以及内外部多变的环境,管理导向也从对员工的行为控制转到如何激发员工自主管理,这为员工敬业度研究提供了基础。作为我国经济体系支柱产业,我国化工行业产值占全球化工产值的40%,居世界第一。但化工在进行生产时普遍具有易燃易爆、有毒有害、以及易腐蚀等特点,同时原材料及废弃物容易造成环境污染问题,潜在的
机械臂是一种复杂的机械控制系统,它能够代替人进行大量重复性的工作,如搬运、喷涂、焊接、装配等。然而,对于工业生产线上所使用的机械臂,只能够按照固定的流程在具体的流水线上执行确定性的任务。为了让机械臂在更复杂的场景中得到应用,需要研究适用于现实环境的机械臂智能控制算法。抓取某个指定的物体而不是抓取任意物体,是在现实场景中实用的需求。本文聚焦于机械臂控制问题中的指定物体抓取问题,深入研究了基于深度学习
当前我国保险行业发展相对稳定,但其经营和管理依然会随着社会结构、生存环境、市场调节等因素的变化而日趋复杂。在此背景下,尤其受社会突发公共危机事件影响,市场的持续性、不定性风险因素增加,保险公司会面临企业管理方面的挑战与考验。2020年初爆发的新冠肺炎疫情正是目前全球范围内最大的突发公共卫生事件,多数保险企业也在这项事件中受到了较为直接的影响。保险企业为实现平稳发展,需要在对市场有较大冲击的公共事件
WB公司是一家经营互联网广告业务的新媒体广告公司,公司成立以来以网络竞价广告投放、数据回收分析、代理运营媒体账户为主要经营业务范围。近几年,随着中国移动互联网的高速发展、智能手机的快速普及,互联网广告行业发生了翻天覆地的变化。特别是互联网广告的载体形式:从第一代的里程碑式产品BBS(Bulletin Board System,网络论坛,与户外广告牌性质相同模式,通过电脑、网络来传播或获得消息);到
近年来,随着所需的神经网络模型越来越复杂,视觉分类任务的多样性也随之增加,不断刷新着其准确性。但对分类精度性能的要求越来越高,使得神经网络结构越来越深,对实现图像分类任务所需的计算能力和内存大小提出了更高的要求。压缩和加速卷积神经网络结构以减少对硬件的依赖性成为研究重点,在网络性能、模型参数量和计算速度之间寻求一个平衡成为研究关键,从而使边缘设备上处理的的数据更加有效。基于此,本文聚焦于基于梯度优
人物属性识别旨在识别给定人物的视觉外观特征,是计算机视觉领域的一项重要研究课题,被广泛应用于人物检索、行人识别、场景理解等多个领域中,具有广泛的应用前景。在人物属性识别任务中由于属性尺度多样、数据集质量欠佳,现有人物属性识别方法对于细粒度属性识别效果不佳。针对上述挑战,本文构建了一个细粒度人物属性数据集,并且提出了三种细粒度人物属性识别算法。本文主要研究内容如下:1.本文构建了适用于细粒度属性识别
随着我国和全球贸易与经济一体化建设进程的推移和加速,加快了促进国际贸易结算业务的蓬勃发展,同时也使得行业竞争加剧。国有商业银行作为先行进入这一市场的“领头军”,具有优越的市场优势。但随着竞争的加剧,也逐渐“力不从心”。如国有商业银行推出的国际结算新产品缺少创新,容易被其他银行“复制”,在银行国际结算市场竞争已经加剧的情况下,没有做到结合自身的特色,发挥自身的优势,结局自然没有达到预期,鉴于此,国有
近年来,军队改革任务基本完成,为了适应军队和国防建设改革调整的需要,顺应时代的发展,立足部队的会计管理现状,需要进一步探索新形势下部队财务管理的模式。随着管理形式的变革和管理要求的提高,武警部队也顺应形势要求,采取会计集中核算形式,在各武警总队成立财务结算中心。军队财务结算中心是管理军队财务活动的组织。而军队财务活动包括军费取得、分配和使用等。军队财务结算中心的高效运行关系到军队财务能否为军队现代
目的 合成盐酸瑞芬太尼原料药的有关物质,为其质量研究提供参照物。方法 以瑞芬太尼的中间体1-苄基-4-(苯基氨基)哌啶-4-羧酸甲酯(6)为原料,经酰化反应、氢化反应及加成反应,合成盐酸瑞芬太尼的有关物质1-(3-甲氧基-3-氧丙基)-4-(N-苯基乙酰胺基)哌啶-4-羧酸甲酯(有关物质B)、1-(3-甲氧基-3-氧丙基)-4-(N-苯基丁酰胺基)哌啶-4-羧酸甲酯(有关物质D);以瑞芬太尼为原料