【摘 要】
:
随着互联网行业的发展,深度学习技术在各个研究领域得到了广泛的运用,特别是在计算机视觉相关领域。人脸表情识别属于学科交叉的领域范畴,它的研究可以让机器学习人类的情感,有助于提高人机交互的效率,这一技术可以推广到医疗、交通、教育等不同的日常情景。但表情识别的准确率容易受表情图像中光线、角度、细节等因素影响。因此,为进一步提升表情识别网络模型的性能,本文共分三个方面对表情识别深度网络进行改进,主要工作包
论文部分内容阅读
随着互联网行业的发展,深度学习技术在各个研究领域得到了广泛的运用,特别是在计算机视觉相关领域。人脸表情识别属于学科交叉的领域范畴,它的研究可以让机器学习人类的情感,有助于提高人机交互的效率,这一技术可以推广到医疗、交通、教育等不同的日常情景。但表情识别的准确率容易受表情图像中光线、角度、细节等因素影响。因此,为进一步提升表情识别网络模型的性能,本文共分三个方面对表情识别深度网络进行改进,主要工作包括:(1)将分组卷积和上采样方法加入残差网络。为提取表情图像中更多的特征细节,本文提出一种结合特征分组上采样的表情识别算法。首先,在RAF-DB数据集上进行对比实验,实验结果表明,改进方法可以显著提升模型的性能,但不同的分组数会对性能产生影响。然后,在最佳分组数下其它数据集上进行实验,结果同样证明了该方法的有效性。(2)将表情平均特征的概念引入表情识别领域。针对人脸表情识别任务的特点,本文提出一种提取表情平均特征的模块。该方法中,将人脸表情特征分为表情平均特征和表情个性特征。首先,将数据送入网络中提取表情个性特征,再将同一批次所有的表情个性特征融合为表情平均特征。然后,将上述两种特征融合为最终的表情图像特征。在多个数据集上的实验结果表明,该方法可以大幅提升基准网络的性能。(3)将注意力机制引入表情识别网络。为了使网络可以提取更多有效的特征信息,同时抑制冗余信息和噪声,本文在基准网络的结构中加入注意力模块。首先,在RAF-DB上进行对比实验来确定效果最优的注意力机制。结果表明,空间注意力对网络性能的提升最为明显。然后,在其它数据集上进行验证实验,结果同样证明了空间注意力的有效性。在与众多先进算法的比较中发现,尤其在RAF-DB数据集上,本文的算法精度极具竞争力。
其他文献
红外摄像头主要应用于低光照或夜间条件下的监控系统,是城市视频监控系统重要的组成部分,在可见光图像与红外光图像之间检索行人对于城市安防以及刑侦工作的高效开展起着重要作用。因此跨模态行人重识别的研究十分重要。跨模态行人重识别指在可见光图像与红外光图像之间检索行人。现有基于深度学习的跨模态行人重识别模型识别精度普遍较低,原因是两种图像成像方式不同,风格上存在较大差异,提取出的图像特征缺乏另一模态信息,而
作为人工智能的重要应用领域,智慧医疗具有将生理数据与医学知识联系起来的关键能力,在提高医疗服务质量的同时降低医疗成本方面显示出巨大的潜力。同时,基于机器学习模型的智慧医疗服务也能借助云计算等新兴技术,在提升数据服务质量的同时降低行业从业门槛,促进以人为中心的智能解决方案。基于数据和机器学习模型的智慧医疗系统需要采集用户的生理数据来提供高质量的数据服务。然而,医疗数据的敏感性在用户隐私方面极为关键,
随着大数据时代的到来,无论是获取数据的渠道和方式,还是数据本身的大小、类型和结构都越来越多样化,这使得数据挖掘的发展越来越具有挑战性。近年来离群检测逐渐成为数据挖掘领域中的热门研究方向,它被广泛地应用于包括社交网络、移动支付和购物系统等在内的众多领域,因为除了常规数据外,少数离群点往往也能带来有价值的信息,并且随着业务的升级,对离群检测算法能够更有效地处理各种复杂的数据的要求也越来越高。本文针对现
土地利用/覆盖变化(LUCC)的研究可以帮助人们更好地对土地资源进行合理的配置,使得社会能够可持续发展。冯·诺伊曼提出的元胞自动机能够有效模拟从大量基本单元的相互作用中涌现出的包括自组织结构在内的复杂现象,因此被广泛应用于土地利用变化的模拟。目前针对基于元胞自动机的土地演变模型的改进大都集中在前期的适应性概率的计算方式上,比如使用神经网络、逻辑回归、支持向量机等机器学习方法,而对元胞自动机模型自身
<正>一、问题的提出目前,社会对高质量学前教育资源的需求日益迫切,幼儿师资的培养要求随之发生显著变化,直接影响着高等院校学前教育专业人才培养的走向。2018年《教育部关于实施卓越教师培养计划2.0的意见》提出贯通职前职后,创新机制模式,深化协同育人的指导方针,要求支持建设一批省级政府统筹,高等学校与中小学(幼儿园)“协同开展培养培训、
互联网用户数的急剧膨胀导致相关数据量激增,由此产生的信息过载问题持续影响着人们的生活。推荐算法可以帮助人们快速从海量信息中获取真正需要的内容,摆脱信息过载并节省信息筛选的成本。在为人们带来便利的同时,推荐算法自身也暴露出了诸多问题。目前推荐算法的改进工作大多以各类型上下文信息构建用户和项目之间的联系,再融入如矩阵分解、深度学习等多种技术,提升算法的预测精准度。针对目前推荐算法中存在的冷启动问题和预
近年来随着人们的生活水平不断提高,人们承受的压力也逐渐增加甚至部分人由此导致了如睡眠质量变差等各种问题。有研究表明合适的音乐可以改善人的睡眠质量,但由于音乐种类众多使得寻找适合自己的音乐也成为一个难题,本文的目标是通过深度学习技术来实现睡眠音乐的自动生成,从而缓解这个难题。本文实现睡眠音乐生成的方法主要包括主旋律提取以及音乐生成两个方面的内容。其中存在许多难点:1)音乐数据不同于普通的序列数据,可
最大团问题(Maximum Clique Problem,简称MCP)是一类NP难问题,有效求解它的精确算法大多数是基于分支定界(Branch-and-Bound,简称B&B)框架的,其中的上界策略对缩小解空间、提高算法效率起着重要作用。目前应用最广泛的是基于图着色的上界,但该上界与最优解之间常常存在一定的差距而导致解空间过大。此外它的时间复杂度总是大于O(n2),当图规模较大时它可能对算法效率产
最近数十年,信息技术尤其是互联网领域相关技术的高速发展,催生出的数据在样本数量与维度上日益庞大。在高维数据中,样本数通常难以均匀覆盖高维空间,这将导致维度灾难,严重损害机器学习算法的性能。特征选择通过从原始特征中挑选部分特征,精简使用特征的数目,避免了样本数与维度严重不相称的情况,已成为数据挖掘领域中常用的预处理技术。近年来,基于进化计算技术的特征选择算法备受关注,这得益于它们优秀的全局搜索能力。
传统的中小学地理教学经常使用地球仪作为辅助教学工具,虽然地球仪能直观的展示相关地理区域,但是由于地球仪本身的限制而无法承载过多的信息,而增强现实(Augmented Reality,AR)技术能够将虚拟信息叠加到现实场景上进行实时交互,将AR技术与地理教学相结合可以使教学内容更加丰富、生动、有趣,能够激发学生的学习兴趣。目标检测算法具有较强的识别物体的能力,将目标检测算法与AR技术相结合,可以提高