【摘 要】
:
人脸验证技术是近年来计算机视觉最为热门的研究方向,其被广泛应用于各种身份验证场景。目前对于人脸验证的研究已经发展到了较为成熟的阶段,现有算法在LFW人脸验证数据集上已经达到了99%的准确率。数据是深度学习算法的核心,取得这样优秀成绩的算法大部分都是基于上百万的人脸数据的前提下训练的。然而在实际应用中,并不是所有的场景都能够获取到大量的脸人图片训练样本的,例如人证比对和人脸亲属关系验证都是目前人脸验
论文部分内容阅读
人脸验证技术是近年来计算机视觉最为热门的研究方向,其被广泛应用于各种身份验证场景。目前对于人脸验证的研究已经发展到了较为成熟的阶段,现有算法在LFW人脸验证数据集上已经达到了99%的准确率。数据是深度学习算法的核心,取得这样优秀成绩的算法大部分都是基于上百万的人脸数据的前提下训练的。然而在实际应用中,并不是所有的场景都能够获取到大量的脸人图片训练样本的,例如人证比对和人脸亲属关系验证都是目前人脸验证中的小样本问题。对于小样本人脸验证问题本文有如下几点贡献:针对小样本人证比对的问题。本文通过网络收集了一个具有1万多人的模拟人证数据集,该数据集是目前已公开的质量最高、数据量最大的模拟人证比对数据集。同时,为了解决小样本情况下的人证比对问题,本文提出使用伪孪生网络将注意力模块集成到证件的特征提取模块中,利用特征融合方法将生活照与证件照人脸特征进行融合再进一步的进行人脸验证。最终,当FAR=0.1%的情况下,本文提出的伪孪生网络模型在自建数据集上验证准确率为97.20%,在公开数据集上的验证准确率为96.26%,该结果显示本文算法在样本量较少的情况下仍然能够取得较好的精度。针对基于人脸的亲属关系验证问题。本文采用孪生网络与关系网络融合的方式对亲属人脸特征进行关系建模。为了解决家庭成员中非血缘关系的夫妻之间的人脸不具备相似性的问题,提出了一种基于家庭的多中心损失函数,利用该损失函数对亲属人脸进行优化能够取得更好的特征学习效果。实验结果表明,本文提出的孪生关系网络在公开亲属验证数据集FIW上,平均准确率达到了78.1%,尤其是在祖父母与祖孙的亲属关系验证实验中,准确率达到75.3%,比其他算法提升了4.6%,但是在其他亲属关系的验证上提升较少只有1-2%左右。
其他文献
近年来,教育行业涌现出一批旨在培养中小学生创造能力的校外教育机构。大多是照搬国外现成的机器人产品,再或是将国外已有的理论成果引进国内市场。优点是在国内传统教育模式中开辟了一条独特的道路。但大多理论薄弱,内容浅显,盈利至上。不难发现,现有关注中学生创新思维发展的相关文献甚少。并且在有限的相关文献中,大部分是基于教育学理论的角度着手,探讨如何通过提升教师能力或教育氛围的方法来促进我国素质教育,真切实际
在空间环境中,液态合金处于热力学亚稳态,这非常有助于研究深过冷熔体的材料结构和热物理性质。受限于成本技术等原因,研究者通过构建静电悬浮结合落管装置模拟空间环境,同时使用高速摄像机捕捉深过冷熔体的下落图像,以研究其熔凝过程。但由于图像获取设备曝光时间等硬件限制,拍摄到的深过冷熔体图像分辨率较低,不利于进一步研究其热物性和凝固界面等性质。使用超分辨重建等软件设计方式可以更准确重构图像轮廓信息,有效提升
缺陷的产生是光刻工艺中不可避免的,主要包括光刻材料的物理特性和工艺因素引入的各种缺陷,以及随着特征尺寸不断缩小而使实设计与制造不完全匹配引入的成像缺陷等,在一定程度制约着芯片制造业的发展。目前随着集成电路进入亚纳米技术节点,可识别的最小缺陷越来越精细,这给光学和电子束缺陷检测系统带来了挑战。缺陷是芯片良率的主要影响因素之一,本研究涉及的缺陷包括固体残留、坍塌、水渍污染。这些缺陷特征跨度大,对设备的
激光雷达能够采集场景的3D点云数据,可快速、准确的得到被测量物体的深度及重建目标物体的几何模型,而光学相机可对场景采集具有丰富细节的高清晰度2D可见光图像数据。激光点云与可见光图像的融合能够结合二者的优势,使只能表现物体轮廓的3D点云数据具有真实的颜色,大大提升可视性,在三维场景重建、环境交互等领域中发挥了重大作用,从而促进云景观、娱乐交互、自动驾驶以及无人设备等领域的发展。为了标定设备以及提高精
城市化进程的不断加快,使得城市用地越来越紧张,且随着大量工业化建筑的急剧增加,生态系统被破坏,环境恶化,能源短缺,城市公共空间缺失等问题随之出现,人类面临着严峻的生存危机。在此背景下,人们把追求生态环境效益作为城市设计的主要目标,巧妙的利用和顺应自然环境、与大自然密切联系着的覆土建筑逐渐成为推动生态建设的一股中坚力量。覆土建筑从古代的穴居到近代的窑洞,再到当代的公共建筑,其适用范围越来越大。因此,
通过分析唇部动态识别出说话者的表达内容是唇语识别的基本目的,其在人机交互领域是广受关注的研究项目。由于传统唇语识别模型具有速度慢,训练难度大的特点,在基于不同场景的唇语识别技术上需要大量的人工设计与经验性处理。所以本文选择基于深度学习建立唇语识别模型,但是在资源紧凑的设备上,大部分性能优异的卷积神经网络都无法展示自己的高效识别能力。因此,卷积神经网络的压缩与加速成为众多学者的热门研究课题,经过网络
水下鱼类识别在合理开发渔业资源,维持生态平衡等方面有大量的应用需求,开展水下鱼类识别的研究具有广阔前景。然而受限于鱼类数据集规模通常较小、鱼类特征复杂等因素,使用既有鱼类识别方法获得的结果往往存在识别精度不高、检测速度慢的问题。为解决上述鱼类识别挑战,本文对比分析了目标检测算法的网络架构,基于深度学习技术设计了两种方法,并通过对比实验验证了模型的有效性。本文的主要研究内容如下:针对如何提升水下鱼类
随着近年来伺服技术的不断改进,多轴同步系统的应用越来越广,充分考虑刚度、阻尼和质量等影响机械系统动态性能的因素,建立一个高精度的电火花龙门式机床多轴同步系统,对电火花机床等数控设备的开发与生产具有重要意义。面对目前多轴同步控制存在的同步性能差,易因外界扰动失去其稳定性等缺陷,本文针对电火花加工龙门式机床,根据其电加工摇动、平动以及Z轴多次往复的加工特点,对机床的X、Y、Z轴均采用双轴同步控制,通过
随着深度学习及人工智能的发展,唇语识别技术在计算机视觉及人机交互领域有着深厚的发展前景与应用需求。尤其是在利用自动唇部识别技术来改善听力障碍者和发音障碍者的社交互动方面,更是人工智能在医疗保健和康复中最有前途的应用之一。所谓唇语识别技术就是通过嘴唇视觉图像的动态变化来识别主要人物表达的内容。当前阶段,唇语识别技术主要停留在对算法以及计算机性能的研究上,很少将其真正的运用到实际生活场景中。因此,本研
地震勘探作为最有效的油气勘探方法之一,一般包括地震资料采集、地震资料处理、地震资料解释三个阶段。在实际采集工作中,存在由于地表起伏和低降速带的变化而造成的信号干扰,为此,首先需要对地震资料进行静校正。初至拾取是得到合理静校正结果的先决条件,它为静校正过程提供了进行后续计算所需的静校正量。现有初至拾取方法主要分为自动化和半自动化方法。一般而言,对于数据单一、噪声干扰小的资料,现有自动方法多数可以快速