基于注意力机制的人脸识别

来源 :南昌大学 | 被引量 : 0次 | 上传用户:fuzhi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络技术的飞速发展,人脸识别成为模式识别与人工智能领域研究的热点。传统人脸识别方法主要依靠特定场景的手工特征进行特征提取,鲁棒性较差,应用场景受限。而基于卷积神经网络的人脸识别方法通过多层级联的复杂线性结构直接从人脸样本图像中提取区分度更高、更具有表达能力的人脸特征信息,从而提高人脸识别准确率。人脸识别技术的核心在于如何提取强区分性的人脸特征,鉴于此,本文聚焦于特征提取网络结构,对基于注意力机制的常规人脸识别方法和轻量级人脸识别方法进行探究,主要研究工作如下:(1)提出基于混合注意力机制和改进深度残差网络的人脸识别方法,该方法特征提取网络结构是在ResNet-50的基础上做出合理改进得到的,对输入层采取更小的卷积核来保证特征图的分辨率;采用改进后的金字塔残差块来搭建主体结构,并在残差块中引入混合注意力机制,将特征图之间的通道和空间信息结合起来,增强提取人脸关键特征的能力;输出层添加Dropout和批归一化操作,提升模型的泛化能力和训练效率。使用增量角度域损失函数Arcface训练,增强人脸样本类内紧凑性和类间差异性,实验表明所设计的方法在公开数据集上有着较高的识别准确率。(2)针对移动端设备硬件条件的限制,常规人脸识别算法模型受限于大量的参数和计算量而不能进行部署的问题,提出结合高效通道注意力机制的轻量级人脸识别方法。该方法在MobileFaceNet的网络结构基础上进行改进,结合高效通道注意力机制进一步提高网络人脸图像跨区域特征交互信息的能力,将特征图之间的通道信息结合,使得网络更能着重于人脸关键特征的提取。同时使用自适应缩放余弦损失函数AdaCos进行训练,无需人为调整超参,提高训练效率和收敛速度,实验表明所设计的轻量级人脸识别方法在公开数据集上有着较高的识别准确率。
其他文献
随着微显示技术的高速发展,越来越多的厂商开始研发硅基OLED(Organic Light-Emitting Diode on silicon)微显示器。而国内的硅基OLED技术仍不成熟,所以为了提高产品的良品率、优化生产工艺和减少生产成本,在产品生产过程中引入缺陷检测技术。传统的检测技术是依靠人眼进行检测,因受到人的主观意识的影响,无法保证检测标准一致,存在效率低和检测精度低等缺点。而近些年来一门
图像恢复的目的是从退化的观测图像中尽可能恢复出干净的图像。图像恢复问题长期存在,并且是计算机视觉研究的基本问题。然而图像恢复问题的数学表达和图像恢复算法的普适性问题一直没有得到很好的解决,这些问题阻碍着图像恢复的进一步研究和发展。近期深度学习的深入研究和发展为解决图像恢复问题提供了一个很好的解决方案。事实证明,更为强大和全面的先验信息和具有普适性的无监督学习算法将显著提升算法的恢复能力。本文的研究
在这个追求速度的时代,人们的出行方式发生巨变,地铁因为便捷、舒适、平稳等优点,受到人们的热捧。受其影响,地铁热线系统也得到了迅速地发展。南昌地铁热线一期系统已经使用了超过五年,因其所使用的技术比较陈旧以及使用年限长等原因,南昌地铁热线一期出现了不稳定、部分电脑宕机等问题,本系统采用全新先进的开发技术,实现地铁热线系统中工单流转、通知公告发布、客服人员管理等功能。之前的系统使用的是SSM框架,采用的
孤独症谱系障碍(Autism Spectrum Disorder,ASD)是一种起病于发育早期的神经发展紊乱疾病。ASD的早期诊断在ASD的干预中起着至关重要的作用,尤其是对于ASD儿童。通常ASD儿童需要由经验丰富的医生结合各种检查评估进行诊断,但这种方式费时又费力且易受主观因素的影响。因此在本文中,我们探索了两种基于外在特征的孤独症辅助诊断方法。在第一阶段我们围绕采集孤独症儿童视频数据库(Ex
习近平总书记在参加十三届全国人大五次会议内蒙古代表团审议时强调,贯彻新发展理念是新时代我国发展壮大的必由路。2015年1月,习近平总书记考察云南时指出,要在推动产业优化升级上下功夫,在提高创新能力上下功夫,在加快基础设施建设上下功夫,在深化改革开放上下功夫,扎扎实实走出一条创新驱动发展的路子来。2020年1月,习近平总书记再次考察云南时指出,要加快建设现代化经济体系,把握供给侧结构性改革这条
期刊
多模态医学影像可以反映人体不同组织的不同视觉特征,已成为人工智能、生物医学、计算机科学等学科的主要研究对象。基于多模态医学影像的病灶分割可应用于疾病诊断、术前方案、智能医疗和医学大数据分析等研究领域。近年来,随着深度学习算法的快速发展,基于深度神经网络的多模态病灶分割已取得了较大进展。然而,受扫描时间、采集成本等因素的影响,临床上有效的多模态影像数据样本少,因此不利于以数据驱动的人工智能算法在该领
信息化时代互联网正在快速地发展,大多数人都会利用网络来传递信息,与此同时信息的安全问题也受到广泛的关注。数字图像是信息的重要载体,为了保证数字图像信息的安全,对图像进行加密是最有效的方法之一。本文提出了两种基于五维超混沌系统的彩色图像加密方案,具体内容如下:(1)设计了一种结合SHA-256函数和五维超混沌系统的彩色图像加密方案。引用SHA-256函数计算明文图像的哈希值来控制Arnold映射的系
虚拟手术仿真技术可用于低年资医师手术训练,避免在实际手术中出错。然而大多研究者都是针对传统的手术操作开发虚拟手术系统,少有人针对电切割这类新兴手术操作搭建虚拟手术平台。本文针对现有的虚拟手术仿真中存在的问题:(1)模型孔洞问题;(2)手术烟雾仿真计算负担较大;(3)涡粒子烟雾难以施加碰撞边界条件;(4)烟雾与虚拟手术系统结合难,开发了一套包括切割肺组织和电凝肿瘤组织的电切割虚拟手术系统,解决了虚拟
目前,随着人工智能的快速发展,基于人工智能的算法被广泛应用在生活中各个方面。其中基于计算机视觉的算法发展尤为迅速。分类与回归问题是计算机视觉中最为常见的两类问题。计算机视觉研究大多围绕这两类问题展开。随着深度学习的发展,越来越多的算法被提出来解决这些问题。其中注意力机制是最近比较热门的一个研究方向,被应用到计算机视觉问题中来解决各种相关问题。本文主要研究注意力机制在计算机视觉中分类和回归两类问题中
随着互联网不断融入到社会经济和日常生活中,人们已习惯于进行各种在线信息查询和交互行为(如数据检索、信息查询、网络购物、社交、导航等),网络数据、信息的数量及其应用飞速增长,导致如何在海量信息中,准确、快速获得所需要的信息成为近年来的研究热点。其中,各类推荐系统作为一种解决该问题的有效方法,尤其是协同过滤算法,已经取得了不少的研究成果并被广泛应用。然而,相关算法在稀疏性、冷启动、抵御托攻击等方面,仍