【摘 要】
:
人脸表情识别是一种通过计算机视觉方法分析人脸图像中的表情特征并识别其表情类别的技术,是计算机视觉领域的一个重要研究方向。人脸表情识别研究可以分为受控制场景下的表情识别和自然场景下的表情识别,目前的表情识别技术在受控制场景下能较为准确地识别表情类别,但在自然场景下表现不佳,无法满足实际应用需求。因此自然场景下的人脸表情识别是亟待解决的重要研究课题。自然场景下人脸表情识别的主要困难在于图像中存在不规则
论文部分内容阅读
人脸表情识别是一种通过计算机视觉方法分析人脸图像中的表情特征并识别其表情类别的技术,是计算机视觉领域的一个重要研究方向。人脸表情识别研究可以分为受控制场景下的表情识别和自然场景下的表情识别,目前的表情识别技术在受控制场景下能较为准确地识别表情类别,但在自然场景下表现不佳,无法满足实际应用需求。因此自然场景下的人脸表情识别是亟待解决的重要研究课题。自然场景下人脸表情识别的主要困难在于图像中存在不规则遮挡和姿态变化。现有方法大多数使用特征点等先验信息裁剪和对齐人脸来解决遮挡和姿态变化问题。但是当人脸特征点检测精度不高时,这些方法性能就会大幅下降。为此,本文提出了基于空间变换网络的多示例学习方法,不需特征点等先验信息,可以有效解决表情识别中的遮挡问题和姿态变化问题。本文的主要贡献可以概括为如下三点:(1).提出了基于空间变换网络的多示例学习表情识别方法(简称STNMIL),解决了自然场景下影响人脸表情识别的姿态变化问题。STNMIL利用空间变换网络得到包含样本局部对齐表情信息的多个示例图像,将生成的示例和原始人脸图像打包进行识别。通过约束空间变换参数,使得生成的示例之间具备空间独立性,增强示例之间的互补性,并约束生成图像不发生扭曲形变,从而提高生成图像的质量。同时对示例包采用基于注意力机制的多示例学习卷积神经网络,让各示例实现特征级的自适应融合,以提升模型的表情识别性能。(2).在上一工作的基础上,提出基于多尺度子块决策层融合的表情识别方法(简称MSSTN),解决了自然场景下影响人脸表情识别的遮挡问题。MSSTN生成多尺度局部子块,生成小尺度的子块图像能增强模型对局部遮挡和头部姿态变化的鲁棒性。同时采用两级融合机制,首先利用带注意力的特征层融合机制融合相同尺度子块图像的深度表情特征,再利用决策层融合机制融合原图和多尺度子块图像的表情信息,进一步增加互补信息,提升模型性能。(3).提出了交替迭代的优化策略,解决了复杂网络难以使用端到端训练的问题。按顺序交替迭代优化网络的损失,降低单次梯度反向传播需要更新参数量,提升模型收敛速度。此外,各子块的损失和融合后的损失交替迭代优化,还可以防止子块部分参数过拟合,提升整体网络模型的表情识别性能。实验证明,基于空间变换网络的多示例学习表情识别方法可以在无需特征点信息的条件下自适应对齐原图像中发生姿态变化的表情区域,提高模型对姿态变化干扰的鲁棒性;在此基础上,基于多尺度的子块决策层方法,增加采样生成更小尺度的子块,可以提升模型对遮挡干扰的鲁棒性,提高模型自然场景下表情识别的性能。
其他文献
战斗精神,是军队总的精神面貌和气质特征的具体体现,是战争成败的决定性因素之一,习近平总书记在视察海军驻三亚部队期间,特别强调"抓思想政治建设,必须把培育战斗精神、培养战斗作风突出出来,强化官兵当兵打仗、带兵打仗、练兵打仗的思想,探索形成战斗精神培育的长效机制",克劳塞维茨也曾提出"如果把物质的原因和结果比作是刀柄,那么精神的原因与结果就是锋利的刀刃"①的论述。南昌起义前后,由于起义军内旧军队
近年来,随着中国国际地位的提升,全球范围内渐渐兴起了一股“汉语热”。对外汉语言教学,一方面通过以孔子学院为代表的传统线下汉语教学机构进行传播,另一方面也需要汉语学习工具和平台的支持。但目前市面上大部分学习工具和平台是针对国人的,鲜有结合中国文化针对外国人进行口语训练和汉语跟读评分的学习平台。因此,针对传统线下汉语教学的不足与外国学习者缺乏口语训练的问题,本文分析了现存语音特征参数评分的局限性,设计
进入21世纪,新兴技术飞速发展,教师知识结构也随时代所需在不断改变。从美国教育学家舒尔曼提出PCK(学科教学知识)的概念以来,国际上很多学者对此开展了很多研究,PCK(学科教学知识)也被业界认为是评价教师专业发展水平的重要指标,但是如何将技术融入到课堂中缺少相关研究理论的支撑。2005年,美国学者马修·科勒和庞亚·米什拉在PCK(学科教学知识)概念的基础上首次加入技术知识,提出了教师TPACK的理
案例学习是法学实践课堂的核心内容。在传统法律教学中,课内的案例学习素材依赖于教师人工筛选后推荐给学生,案例数量有限且过于消耗教师的精力;课后的案例素材需要学生自行检索,面对指数级递增的法律文书,学生易产生信息迷航和信息厌倦等问题,难以做到快速而又精准地筛选。此外,现存的传统学习平台难以满足垂直类专业领域中案例教学活动的开展。因此,如何让学习平台更加专业化、智能化地辅助法学实践教学活动的开展是本文研
教师提问是教师推动课堂教学、促进学生学习水平发展的重要手段和方法之一。在高中数学课堂的教学中,由于受到教学内容逻辑性、抽象性的影响,教师提问的重要性得到了进一步的突出。因此,结合实际教学的情况分析当前高中数学课堂中教师提问存在的问题和原因,并分析改善的策略,是发展高中数学课堂教学水平的重要路径,具有不可替代的现实价值。本文的研究,立足上述考虑,以宜春市为主要调研对象,试图探讨宜春市高中数学课堂教师
交通网络是近代社会的重要组成,随着社会的发展,交通网络已融入我们的生活。在交通网络中,车辆是人们日常生活接触最多的交通工具,车辆道路行驶状态与城市拥堵密切相关。船舶作为国际贸易最主要的运输方式,行驶时长影响贸易往来,与经济发展直接挂钩,值得对其展开研究,本文将分别从船舶交通和车辆交通两个方向进行研究。在船舶交通方向,本文研究的内容为船运到达时间ETA(Estimate Time of Arriva
初中阶段的学生身体素质和心理水平都迅速发展,初中阶段数学的学习在基础教育中起着承上启下的作用,因此教师应积极探索教学思路和教育方法,使初中数学教学科学有效合理地推动学生健康发展。平面几何作为初中数学的重要组成部分,是学生初步建立空间概念、发展形象思维和几何直觉的必要学习内容。圆和三角形是几何图形中最具有代表性的两种图形,也是学生最初接受的最为常见的两种几何图形。因此笔者选取初中数学圆和相似综合应用
土壤是陆地生态系统中拥有最大碳储存潜力的碳库,因此在全球碳循环与平衡、气候变化等研究中广受关注。土壤有机碳(Soil Organic Carbon,SOC)作为土壤重要属性,是评估土壤肥力与质量的重要指标,影响农事生产、气候变化、土地退化防治和生态系统服务功能等各个方面。明确SOC的空间分布特征及其储量是研究其在全球碳循环中的地位作用以及将SOC的变化纳入环境过程建模的基础,本文以江汉平原为研究区
随着信息化社会的高速发展,图像信息的相关应用越来越广泛,尤其是在人工智能领域中占据着举足轻重的地位。然而,一张普通的图像中可能蕴含着大量的个人隐私信息,这些敏感信息一旦泄露,后果不堪设想。因此需要对数字图像进行加密处理。Arnold变换作为一种最为常见的图像加密方式,因其变换方式简单,置乱效果显著而被广泛运用于图像加密中。但是Arnold变换同时也存在着一定的局限性,例如密文图像与明文图像的直方图
物理学科核心素养是学生通过对物理知识的学习而逐渐形成的正确价值观、必备品格以及重要能力。信息技术的高速发展和应用的不断深入,其已经成为教师教学、学生学习的重要手段和技术支撑。对于高中阶段的学生,实现高中物理新授课与信息技术融合可以有效落实核心素养的达成。因此,对核心素养目标下高中物理新授课与信息技术有效、深度融合的研究,具有重要意义。随着我国经济的高速发展,国家对基础教育的持续投入,四川省成都市内