基于深度学习的表情识别算法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:sweetyjiaxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情识别技术是机器学习领域的一个热点和难点问题,在很多领域有着较好的应用前景,快速、精准识别人类面部表情可以满足日渐增长的社会需求。但是,目前的识别技术还存在不同的问题:在表情识别模型进行特征提取阶段,由于表情发生时间短暂、发生的动作幅度小、不同的面部区域发生的表情动作幅度不同,若提取不到更为细致的表情特征,则会导致表情模型的识别率低且泛化能力不足;在表情识别模型训练阶段,由于表情数据样本量不充足,样本类别不平衡,训练集和测试集存在分布差异问题,会导致表情识别模型对个别类表情识别能力弱且鲁棒性差。为了解决上述问题,本文的工作和成果如下:(1)设计了一种用于表情识别的多尺度特征提取深度模型(FCNet)。FCNet包括两个部分——多尺度表情特征提取模块(Fef)和坐标注意力机制算法。Fef模块主要由3个Tfe结构组成。Tfe是一种三分支的特征提取结构,其使用了不同尺度的卷积核,在每一个卷积层后都使用了BN层,并使用Relu激活函数进行非线性变化,增强了FCNet的泛化能力和表情特征学习能力,提升了训练速度和收敛速度。在Tfe结构完成特征提取后,通过跳跃连接的方式,使FCNet获取了融合浅层信息和深层信息的特征。这之后,使用坐标注意力机制对这些融合特征分配基于人脸位置信息的通道权重,增强了FCNet对表情数据的学习能力,最终提升了表情识别的性能。(2)为了继续提升表情识别性能,首先设计了一种过采样算法——FM算法。FM算法包含两种策略:针对相同类别表情的过采样策略和针对不同类别表情的过采样策略。FM算法通过数据扩增的方式缓解表情样本的不充足、不平衡问题。其次基于FM算法,进一步设计了FM-Meta伪标签算法。FM-Meta伪标签算法使用两种数据训练表情识别模型——无标签数据和有标签数据。FM-Meta伪标签算法包含两个神经网络——教师网络和学生网络。相较伪标签算法,教师网络会自适应的根据学生在标签数据集上的表现反馈进行调整,这种调整是依据有标签数据和无标签数据分布差异来进行的。更新后的教师网络以基于无标签数据生成伪标签的形式来指导学生网络训练。通过教师网络与学生网络并行训练,学生网络的表情识别性能会得到提升且更具鲁棒性。在FER2013和MMA数据集上进行了实验验证。实验结果表示,与传统算法相比,FCNet在表情识别准确率上显示出较好的鲁棒性。而进一步使用FM-Meta伪标签算法之后,不仅提升了FCNet的表情识别的效果,而且为模型处理无标签数据提供了一种新的训练方式。
其他文献
随着我国课程改革的不断深入,基础教育也在不断地向素质教育的方向推进,体育教学活动紧跟教育改革步伐,面向全体学生,尊重个体差异以促进学生德智体美劳的协调发展。契约学习法以学生个体差异为基础,按照因材施教这一教学原则来选定教学目标、内容、方法和教学组织形式。结合初中生的身心发育特点和初中体育教学情况,根据契约学习法的特色和教学程序,采用教学实验的方法将契约学习法应用于初中足球教学活动中,以探究此法在初
Pickering乳液是由固体颗粒替代表面活性剂稳定的乳液。与传统乳液相比,Pickering乳液具有更好的稳定性,而且可以选择生物质来源、生物可降解或生物相容性较好的固体颗粒来稳定乳液,以此来适应环境友好的需求。甲壳素是一种具有广泛的来源、良好的生物可降解性和生物相容性的生物大分子,因此受到广大研究者的关注。从虾壳、蟹壳、墨鱼等生物质来源中提取甲壳素来制备纳米甲壳素,并用于稳定Pickering
我国是世界上柚种植面积最大的国家,柚产量位居世界第一,但柚的分等分级仍依赖人工,费时费力,亟需提升商品化处理装备的检测水平与生产效率。本文以琯溪蜜柚为研究对象,研究了琯溪蜜柚三维重建与孔洞补全等关键技术问题,建立了基于三维模型的蜜柚体积、密度、纵径及横径估测方法。主要研究内容如下:(1)构建了用于蜜柚多视图三维重建的机器视觉系统。该系统主要由光照系统、旋转平台、图像采集装置及采集软件组成。实测了横
目的:对比分析高血压基底节区出血破入脑室(Hypertensive basal ganglia hemorrhage breaking into Ventricles,HBGHBIV)患者采取两种微创手术(神经内镜辅助下血肿清除术+脑室外引流术,显微镜辅助下小骨窗血肿清除术+脑室外引流术)的疗效差异,总结它们各自的优缺点,为临床上相关手术治疗方式的选择提供科学依据。方法:1.通过对我院2019年6
近年来,随着精密制造、虚拟现实等领域的快速发展,能够定量描述某些物体快速三维信息的方法成为领域研究热点。结构光条纹投影技术是一种广泛应用的三维测量技术,然而其需要经过条纹图采集、相位恢复和标定等步骤才能恢复物体的三维面形。该方法测量步骤繁琐、测量速度慢,不利于实现快速三维成像。近几年,深度学习方法广泛应用于计算机视觉和图像处理领域。本文将深度学习技术同结构光三维测量方法相结合,提出了基于深度学习的
据公安部数据统计,截止2021年我国机动车保有量已经达到3.9亿。在汽车保有量大幅增长的压力下,城市拥堵及交通事故频发等问题也随之而来。经研究发现,人为因素是造成各类交通事故和城市拥堵的主要原因,而新兴的自动驾驶技术可能是上述问题的最佳解决方案。高精地图作为自动驾驶技术的重要一环,其制作精度和维护难度都影响着自动驾驶技术的普及。交通标志牌又作为高精地图中重要的道路要素,系统准确地检测和识别也就成为
学生是祖国的未来,班主任作为学生在校学习和生活的第一责任人,肩负着重要的责任和使命。尤其是在当今立德树人与“双减”政策的背景下,班主任的工作显得尤为重要,小学在九年义务教育中的重要地位是不言而喻的,小学生活中,班主任对学生的影响极大,小学班主任的工作投入关系着教育教学管理水平,直接关乎学生的综合发展,更影响着基础教育的发展趋势与发展水平。对班主任的工作投入现状进行调查和研究,可以及时了解班主任群体
目前,互联网技术的快速发展,对人类的生活产生了巨大的影响,越来越多的人们喜欢在网上购物,电子商务市场具有无限的发展潜力。服装作为人们的生活必需品,在电子商务的销售额类别中占据国内数一数二的地位,一直受到消费者和企业的广泛关注,网购服装已经成为一种必然的潮流趋势,但由于网购的虚拟性和激烈的市场竞争,服装电商企业面临着巨大挑战。当前电商平台特有的消费者在线评论功能版块,为消费者和企业提供了一个有效的反
电子病历作为提升医生工作效率、实现诊断信息共享的重要载体近年来应用广泛,但其专业性特征与繁杂内容影响病历制作时效性,提高电子病历录入效率并降低医生工作负荷为当前重要课题。随着智能AI技术快速发展,借助语音识别辅助医生收集病历信息突破传统基于模板的固化电子病历,以语音录入代替键盘输入,随时为医生背书诊疗场景以唤醒其潜在记忆,进而实现个性化病历信息的高效复刻,在提升其工作效率的同时降低工作负荷。因此,
普通混凝土的导热系数较高,导致房屋建筑在使用运营过程中能耗过高,而为了得到足够大的热阻,围护结构往往过厚。为减小热交换,节约能耗,减小围护结构厚度,许多学者把陶粒、膨胀珍珠岩、玻化微珠等保温骨料嵌入混凝土中,而气凝胶相比于传统保温材料拥有更加优异的保温性能。本文把气凝胶掺入水泥基质中以减小其导热系数。本文采用研究了气凝胶掺量对混凝土性能的影响,基于实验数据建立了气凝胶混凝土导热系数预测模型,研究了