【摘 要】
:
无感知环境下的人脸识别无需用户停留或注视摄像头,而只需他们自然通过即可被识别,这不仅能够提高用户体验,还能帮助实现人员追踪及搜索等应用。然而,现有的训练数据集缺乏人脸被遮挡、角度大、虚焦和光照过亮或过暗等无感知场景下的人脸数据,从而使得人脸识别模型难以提取这类场景中数据的有效特征,最终导致样本漏识别或误识别。因此,为了让模型具备适应无感知场景的能力,需要在其训练过程中加入大量的这类场景下的数据,从
论文部分内容阅读
无感知环境下的人脸识别无需用户停留或注视摄像头,而只需他们自然通过即可被识别,这不仅能够提高用户体验,还能帮助实现人员追踪及搜索等应用。然而,现有的训练数据集缺乏人脸被遮挡、角度大、虚焦和光照过亮或过暗等无感知场景下的人脸数据,从而使得人脸识别模型难以提取这类场景中数据的有效特征,最终导致样本漏识别或误识别。因此,为了让模型具备适应无感知场景的能力,需要在其训练过程中加入大量的这类场景下的数据,从而增加类内样本数量并增强训练样本的多样性,这通常会采取数据增广的方法来实现。但由于增广方法的源数据和增广的区域都是随机选择的,所以不可避免地会产生新增数据冗余及噪声的问题,从而影响模型的性能。本文的主要研究工作有:(1)针对人脸数据集中具有无感知场景特点的样本数量较少、现有人脸数据增广方法会引起新增数据冗余的问题,提出了一种人脸数据混合增广方法。该方法利用模型在训练过程中累积的特征提取能力,通过在每次迭代中更新差异值参数来动态地筛选出需要增广的数据,并将其分类以应用不同的增广方式,从而减少冗余数据。在LFW数据集上的实验结果显示,与Masi等人提出的人脸数据增广方法相比,本方法能够减少新增样本的数量,且识别准确率提升了0.79%。这说明本方法能够减少冗余数据,提升模型性能。(2)基于以上研究工作,本文针对增广区域随机选择所带来的噪声问题,设计了一种基于特征区域定位的人脸数据增广方法。该方法通过人脸维度激活图对导致图像识别错误的特征区域进行定位,并在此区域上进行增广以减少新增数据的噪声。实验结果显示,与第一项工作提出的增广方法相比,基于特征区域定位的人脸数据增广方法在LFW和IJB-C数据集上的识别准确率分别提升了0.38%和3.29%。本文实现了一个在沙盒容器中运行的无感知人脸识别软件,并将上述研究的数据增广方法应用于人脸识别模型的训练过程中。该软件与百度人脸识别等同类型应用相比,在企业考勤、安防等无感知场景下,对监控设备拍摄到的极端姿态、低分辨率等人脸数据识别效果更好,准确率提升了6.98%。
其他文献
粘度是人体细胞内最重要的微环境之一,细胞内的粘度是细胞健康状态的重要指标,它影响着细胞内物质的扩散、大分子间的相互作用、信号传递等重要生理过程。线粒体是细胞能量的主要来源,在细胞有氧呼吸中起着重要作用。一些刺激会引起线粒体微环境如粘度、p H和极性的改变。线粒体粘度的异常变化已被证实与某些疾病有关。因此,监测细胞线粒体内粘度的改变在生物化学、细胞学和临床医学等领域具有重要意义。传统的粘度测量工具只
在当今社会汽车保有量剧增以及相关事故频发的大背景下,人们对智能交通管理系统提出了更高的要求。而车辆颜色作为视觉信息中重要的表达形式,在交通调查和车辆管理等系统中都起着不可替代的作用,如何高效、精准地进行车辆颜色识别已经逐渐成为计算机视觉领域中的热门研究方向。同时,车辆检测作为识别车辆颜色的重要前置步骤,是否能够有效地检测出车辆区域,将直接影响到对车辆颜色识别的成功与否。随着机器学习技术的不断成熟,
作为人机交互的重要方式,对话系统对于人工智能领域的发展具有重要的研究意义和应用价值。开放领域上的智能对话系统可以参与任何话题的交流,做出自然且逻辑通顺的应答。本文围绕“新话题引导”和“内容一致性”这两个问题展开研究。“新话题引导”可以提高对话的趣味性和交互性,而“内容一致性”有助于建立稳固的交流关系。两者相辅相成,共同作用于开放域智能对话系统的打造。针对“新话题引导”问题,本文提出了一种话题引导型
3-取代3-氨基羟吲哚骨架是多种天然产物重要结构片段,这些化合物显示出广泛的生物活性和药物活性,例如抗肿瘤、抗病毒和抗焦虑活性。因此,近年来,3-取代3-氨基羟吲哚衍生物的不对称合成受到广泛关注。此外,吲哚框架作为生物学重要的结构单元,其生物活性和药用价值促进了其在合成方法学中的发展;其中,将具有独特的物理和生物学特性的含氟基团—三氟甲基引入到手性羟吲哚衍生物中,对于具有药物活性吲哚衍生物的合成和
在移动互联网高速发展的当今时代,随着移动应用的蓬勃发展,各种新业态逐渐催生。自动驾驶、短视频与远程办公等应用的出现也逐渐对图像处理等领域提出了新的要求。彩色图像分割作为一种已经研究多年的计算机视觉领域,也随着不同应用需求的提出与计算技术的提升而更新迭代。本文研究主要集中于对彩色图像分割算法的优化。在彩色图像分割问题中,主要以传统非监督型图像分割算法为主。传统非监督型图像分割算法是一种比较底层的图像
一直以来,爆炸物的滥用给国家与社会安全均带来巨大的威胁,虽然目前对典型的硝基芳香类爆炸物(例如TNT)的检测技术日趋成熟,但对新兴的过氧化物类爆炸物的检测仍是一项艰巨且有意义的挑战。过氧化物类爆炸物中应用最广、危害最大的当属三过氧化三丙酮(TATP)。由于TATP没有紫外吸收与荧光发射,其化学结构中也没有硝基与苯环,因此缺乏有效的检测手段。TATP的稳定性极差,在实验室中无法安全制备与长期保存,易
关系分类旨在确定一个句子中给定两个实体之间的关系类型。目前有监督的关系分类方法需要大量提前标注的数据,而基于远程监督的方法能通过自动对齐语料库的知识来扩展数据量,但是会出现明显的长尾分布问题。因此,如何利用尾部的少量样本完成关系分类成为任务的热点,也是本文的主要研究方向。目前大多数研究都是采用预训练模型结合微调(Fine-tuning)的方式,但是随着模型参数的增多导致微调的过程需要大量的时间和数
投票是我们日常生活中非常常见的一项集体活动,是实现集体决策的一种常规手段。2017年,Mc Corry等人在以太坊区块链上实现了一种自计票投票协议来达成完全去中心化的秘密投票,但现有的自计票投票协议要求所有投票人都必须在规定时间内完成秘密投票,否则就会导致投票失败或者投票人损失押金,而未能及时投票的投票人(以下简称懒惰者)可能并非是恶意的,只是因为网络堵塞或者设备故障,甚至仅仅只是因为临时有事耽搁
蛋白质作为人类生命活动的主要承担者和生物功能的最直接执行者,目前存在多种形式的翻译后修饰,而糖基化是其中最重要的以及研究最广的翻译后修饰之一。质谱技术的兴起对分析检测糖蛋白/肽具有不可估量的作用,但是却不能用质谱对糖蛋白/肽直接进行检测,这是糖蛋白的丰度低以及非糖肽的信号强度高会掩盖被检测的糖肽信号峰所导致的。因此,科学家们研究并开发了一系列对糖肽进行分离和富集的亲和方法,主要包括凝集素亲和法、肼
十多年来,共价有机骨架(COFs)快速进展并取得实质性成就,目前已经开发出分子水平修饰、表面工程、异质结耦合和纳米结构等有效策略来提高光催化性能。不同于非晶态多孔有机聚合物,具备拓扑学分子可设计性是晶态COFs最为关键的特征之一,因而COFs从结构设计到合成过程,乃至COFs的功能化都能实现高度可控,这赋予COFs在结构上的独特优势。目前,COFs作为光功能材料被成功制备和研究,并广泛应用于水分解