【摘 要】
:
近年来,人脸识别算法的发展已经进入了相对成熟的阶段,并在智能安防、支付安全、刑侦追踪等领域得到了广泛应用。随着新型冠状病毒的肆虐,佩戴口罩出行已成为多数人的日常生活习惯,于是戴口罩人脸识别成为了现今的热门研究课题。戴口罩人脸识别研究的难点一方面来自口罩区域的遮挡导致的图像级面部信息完整性被破坏,模型提取到的有效特征减少,以及口罩遮挡带来的图像噪声的影响;另一方面,相较于未被遮挡的人脸图片,戴口罩人
论文部分内容阅读
近年来,人脸识别算法的发展已经进入了相对成熟的阶段,并在智能安防、支付安全、刑侦追踪等领域得到了广泛应用。随着新型冠状病毒的肆虐,佩戴口罩出行已成为多数人的日常生活习惯,于是戴口罩人脸识别成为了现今的热门研究课题。戴口罩人脸识别研究的难点一方面来自口罩区域的遮挡导致的图像级面部信息完整性被破坏,模型提取到的有效特征减少,以及口罩遮挡带来的图像噪声的影响;另一方面,相较于未被遮挡的人脸图片,戴口罩人脸图片的数据不确定性明显增加,进而导致戴口罩人脸嵌入表征对应的特征空间分布面临类间区分度降低与类内区分度增加的问题,人脸识别的难度也随之增加。为解决上述问题,提出了一种基于整体和局部特征联合优化的戴口罩人脸识别模型,结合细粒度特征提取与表征学习领域的相关方法开展了以下研究工作:(1)针对口罩遮挡区域导致的面部信息丢失问题以及遮挡区域带来的噪声问题,结合细粒度图像识别中局部与整体特征联合学习、相互促进的思想,在学习整体特征的同时,利用网络特征图注意力激活情况高效定位具有区分度的局部区域。通过跨分支的细粒度特征区域特征模仿方法,进一步加强网络对局部特征的提取能力,抑制口罩遮挡区域带来的噪声影响。(2)针对戴口罩人脸嵌入表征的特征空间分布区分度较低导致的人脸识别困难的问题,在整体特征学习和局部特征学习的基础上,增加整体特征与局部特征之间的对比学习。通过多尺度的特征空间分布优化策略联合学习,加强对人脸嵌入表征学习约束,最终获得鲁棒性更强的特征表达方式。为验证方法的有效性,在Masked-LFW、Masked-Age DB、Masked-CFP数据集上进行相关的实验,并与当前先进的研究方法进行了对比,实验结果表明:在MaskedLFW、Masked-Age DB、Masked-CFP数据集上以91.79%、79.78%、75.34%的准确率明显高于当前的常用戴口罩人脸识别方法。
其他文献
供水管道是保障日常生产活动正常进行的重要基础设施,在长期使用中受自身寿命或外界破坏性因素的影响会发生破裂造成漏损。及时的泄漏检测对节约水资源、防止二次污染以及可能带来的次生灾害至关重要,目前常用的检测方法通过采集和分析振动信号确定泄漏是否发生。泄漏振动信号十分微弱,采集时受环境噪声影响大,传统的检测方法无法有效地区分环境中存在的非平稳噪声,检测效果不稳定并且依赖检测人员的经验。大量的泄漏检测设备一
纠删码作为一种以条带的形式存储数据的容错技术,广泛应用于当前的大规模存储系统中;相比副本容错技术,纠删码能以更低的存储成本来提供相同容错能力。为了进一步降低存储成本,业界开始研发“大条带纠删码”技术,通过增加条带长度来压缩校验块在每个条带中的比例以节省更多存储空间。然而,现有“直接编码”生成大条带的方式通常因编码速度下降而导致数据生成缓慢。一种可行思路是通过“扩展转换”来生成大条带,即首先将新写数
区块链在金融、能源、医疗、食品等众多关键领域有着极高的应用价值,然而当前区块链的性能严重限制了其在现实场景中的落地。其中最具代表性的以太坊区块链,其区块处理时延严重受限于状态树引入的海量数据库查询。现有的针对性解决方案多会导致显著的负面效应,如内存、网络带宽等硬件成本的急剧上升,因而难以广泛应用。通过深入分析以太坊工作流与负载,观察到状态树单条分支“一热俱热”的访问规律:绝大多数情况下,热点账户及
通信技术与物联网技术的发展导致物联网终端爆发式增长,感知数据和物联网应用呈指数级增长,推动智慧类应用需求高速发展,对计算存储资源提出更高要求。集中式云计算框架受制于网络拓扑、回传带宽和网络延迟等的影响,难以满足智慧应用场景对处理时延和网络开销的需求。边缘计算框架借助靠近物联网终端侧的多接入边缘计算(Multi-access Edge Computing,MEC)设备,卸载全部或部分计算任务,能有效
作为组合优化领域中经典的NP难问题,集合覆盖问题有重要的理论研究意义和工业应用价值。为了求解对时间要求较高的调度问题,如物资运送、机器调度、卫星拍摄,提出了一个带冲突的集合覆盖扩展问题,称为最小最大加权集合覆盖问题(Min Max Weighted Set Covering Problem,MMWSCP)。在该问题中,元素表示需要完成的任务,每个集合具有一个时间段属性,表示该集合中的任务只能在这个
随着大数据时代的到来,当今社会对海量图数据的处理需求日益增加,例如社交网络、电子商务交易等都可以被组织为图数据,而Gremlin作为一种典型的图数据库查询语言,其底层单核处理机的串行执行方式,已无法适应现代大型图数据处理运算的需求,因此多核并行计算已成为提高其查询速度的主要方式。COStream是一种高效的数据流编程模型,采用同步流水线的方法生成可在多核上并行计算的程序进而提高程序执行效率,因此可
随着人工智能技术的发展,当前越来越多的应用试图为移动设备提供智能服务,然而移动设备的便携属性导致其计算资源与电量难以支撑大型深度神经网络(Deep Neural Network,DNN)的运行,当前主流的解决方案是将DNN直接部署在云端服务器,或者将DNN分割成两部分,分别部署在本地移动端和云端进行协同推理,依靠云端服务器充足的计算资源分担本地计算的压力,然而这种方式会将用户的原始数据或未经处理的
知识蒸馏是将一个神经网络的隐含知识迁移到另一个神经网络的过程,其中提供知识的神经网络称为教师模型,学习知识的神经网络称为学生模型。相比于传统的知识蒸馏模型,自知识蒸馏模型不需要外部的教师模型,而是把神经网络最深层视为教师模型,把神经网络的浅层视为学生模型来达到知识蒸馏的效果。现有的自知识蒸馏模型(如BYOT模型)将作为学生模型的各个浅层块一视同仁,忽略了各个浅层块对最深层块的不同影响。通过分析BY
红外小目标检测是指对红外热成像技术获得的包含目标和背景的图像进行目标检测,它被广泛应用于许多现实场景中。传统的红外小目标检测模型大都基于各种假设,难以应对复杂多变的现实环境。近年来,深度学习模型在图像语义分割领域的表现远超传统模型。但是,将现有深度学习模型应用于红外小目标检测问题存在感知域受限、深层网络中目标细节缺失、单一尺度测量和特征不匹配的问题。针对上述问题,提出了一种基于上下文金字塔和特征融
在大数据环境下,数据库管理系统是数据密集型应用中不可或缺的一部分,数据库管理系统收集、存储、处理和分析海量数据的能力对商业和科技领域的决策支持和知识挖掘至关重要。现代数据库管理系统的参数众多,并控制着数据库的运行时行为。如何高效地自动优化参数配置成为当前数据库领域研究的一个热点。基于高斯过程的贝叶斯优化和深度强化学习是目前常用的数据库自动调参方法,前者在高维异构空间的参数调优性能不佳,且无法利用历