基于人脸生成的多姿态人脸识别算法及在教室场景中的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wolfalone0319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是计算机视觉领域中十分重要的研究方向。人脸特征作为辨识性很高的生物特征,具有非接触式、不易更改、直接等优点,广泛应用于安防、刑侦、电子认证、银行交易等领域中。目前,受限场景下的人脸识别技术发展迅速,在研究和应用上都达到了很好的效果,而随着研究的深入,自然场景下的人脸识别成为了最为广泛且十分重要的需求。受限场景对于采集环境要求较高,自然场景中往往无法满足,其采集的人脸受到多种因素的影响,如表情、遮挡、光线和姿态等,其中多姿态的人脸变化是影响人脸识别算法性能的最直接因素,同一个体不同姿态人脸的类内差异巨大,甚至可能超出不同个体之间的类间差异,这使得算法难以提取辨别能力强的人脸特征。基于此背景,本文旨在研究基于人脸生成的多姿态人脸识别技术,通过人脸的归一化生成,消除人脸姿态差异性的影响,进而提升人脸识别算法的性能。为了解决多姿态人脸识别中存在的问题,本研究提出基于三维人脸重建的人脸归一化生成网络,通过全局人脸和局部结构两个支路学习归一化正脸生成,主要的改进点有:(1)结合三维人脸重建和人脸模型的稠密对齐,通过弱透视投影获得正脸投影图像,为人脸生成任务提供人脸形状与结构先验;并基于三维模型对头部姿态进行估计,结合姿态信息对人脸进行自适应编码;(2)采用生成对抗网络框架,生成器基于全局人脸和局部细节,并结合人脸先验设计人脸合成损失;在整体人脸和五官区域(眼睛、嘴巴、鼻子)采用判别器组,提升合成人脸的纹理细节;使用带梯度惩罚项的WGAN,加速网络收敛,保持学习的稳定性;(3)结合人脸特征监督网络将合成人脸的特征约束到真实人脸特征空间中,提升合成人脸的真实性,保持人脸的身份信息并能够直接应用于人脸识别任务中。在受限场景和自然场景下的人脸生成及识别实验中,本文算法能够适应不同的姿态、光照和人脸属性等因素的影响,生成可视效果良好的归一化正脸,并有效提升人脸识别算法的性能,随后通过一系列模型对比验证验证了本研究中人脸归一化生成网络结构的有效性。最后,我们进一步在教室场景中验证我们的人脸归一化生成算法,我们首先基于教室场景下的人脸数据集开展人脸识别实验,其次对教室场景中的潜在需求进行分析并提出了相应的系统设计。
其他文献
近年来,随着医学与计算机科学的不断发展,医疗方案的相关推荐方法得到了越来越多的的关注。将人工智能的相关算法应用于医疗方案的推荐上,势必能改善医学诊断,并辅助医生做出更好的诊断,以造福人类。文章紧密围绕医疗方案推荐算法及其应用这一话题展开讨论,研究提升推荐准确性和加快推荐速度的方法。首先,文章介绍了基于知识的医疗方案推荐方法以及基于案例的医疗方案推荐方法。这两种方法被作为文章研究的基础。针对基于知识
高职院校在生源扩招和师资扩充的背景下,针对师德师风建设过程中存在的教师党支部建设弱化、引领师德师风作用不强;教师法治意识需要完善、规则意识有待增强;师德师风建设长效机制不完善、监督引导不充分等困境,通过强化党对教师的引领,铸牢思想之魂;强化教师法治教育、纪律规范教育;建立健全师德师风建设长效机制,激发教师师德师风自我完善意识来开展高职院校师德师风建设,助力高职院校打造政治强、情怀深、思维新、视野广
随着深度学习技术的发展,计算机视觉相关技术在近些年来取得了巨大的突破,比如物体和人脸识别,物体检测以及物体分割等等。但在计算机视觉领域普遍缺乏对于关系的学习,比如物体检测当中多个物体之间的关系,人和物体交互检测时人和多个物体之间的关系,以及视频任务中帧与帧之间关系的学习。而对于特定的计算机视觉任务,关系学习可显著提升其性能。本文利用关系学习帮助视频摘要和目标重识别两个特定任务,并展示了关系学习在视
三维目标检测算法是无人驾驶系统环境感知的重要一环,在无人驾驶车辆的行为规划和决策中具有重要应用。与二维目标检测相比,以稀疏点云为输入的三维目标检测方面的工作尚未成熟。本文提出了一种新的基于点云投影的实时三维目标检测框架FVNet,它包括两个阶段:准边界框的检测和最终边界框参数的细化。本文首先将原始点云投影到柱面,生成保留丰富信息的前视特征图,然后构建了一个基于关键点估计的无锚检测网络D-Net来检
山上有一块小石头。它很快乐。清晨,玫瑰色的晨曦(xī)染红它的笑颜。夜里,它在清冷的星空下,聆(Iíng)听周边草木的呢喃(nínán)。有一天,它得到了一颗花籽。它把花籽藏(cáng)在心窝里。它对身边的三叶草说:“我就要有一朵自己的花儿啦,我希望它是紫色的,就像你开的花儿那样。”三叶草笑弯了腰:“你?你是石头。有谁听说过石头上能长出花儿来?”
期刊
关于时空轨迹的查询的研究已经进行了数十年。然而,如何测量轨迹的相似性,以及如何有效地表示和索引轨迹仍然是个问题。对于第一个问题,我们讨论了插值不变性的性质,并提出了具有该性质的两种距离。对于第二个问题,我们提出了Trajectory Representing and Indexing(TRI)框架来管理时空轨迹。在这种框架下,首先,轨迹将根据我们的成本估算函数被切分为子轨迹;其次,子轨迹将由一种新
区块链技术是近年来的一个新兴技术与前沿热点,其中区块链隐私保护机制是一个研究热点。传统的区块链只实现了最简单的假名性,不能满足区块链用户日益增长的隐私需求。为了解决这一问题,多种区块链隐私保护机制被提出,比如混币机制、环签名机制、零知识证明机制等。基于环签名的区块链隐私保护机制是其中很重要的一种机制,它通过引入混合地址与真实输入一起形成一个环,然后生成环签名将真实输入隐藏起来。基于环签名的区块链隐
三维人体姿态识别是计算机视觉领域一个非常重要的问题,也是智能人机交互领域的核心技术之一。近年来,人体姿态识别技术发展迅速,二维人体姿态识别准确度不断提升,为三维人体姿态识别提供了新的可能。几何模型在三维计算机视觉领域具有两个主要内涵:其一是相机与成像关系的几何模型,其二是观测目标的几何模型。对于相机视角而言,现有的三维人体姿态数据集相机视角多样性有限,现有方法容易陷入视角耦合的困境,因此需要在流程
随着中国人口老龄化进程的不断加快,老龄患者对医疗的需求正在不断上升,相对应的高龄手术例数也呈逐年上升趋势,虽然当今医疗水平技术飞速发展,手术风险依旧存在。尤其对于高龄患者而言,由于身体素质原因同时伴有大量慢性病,使得手术风险大大增加,对于高龄患者的手术医生往往十分慎重。然而高龄患者对长寿的期望越来越高,想通过手术改善生活质量的意愿也越来越强烈,故在术前做好相应的风险评估显得尤为重要。传统的手术风险
随着人工智能技术的高速发展,人们对自然语言理解、解析和生成的要求也越来越多。而对于四则运算应用题自然语言描述的方法或模型这方面的研究却是少之又少。基于这样的背景条件下,通过研究四则运算应用题文本的特征属性,从中归纳总结出从数字关系到应用题文本自然语言描述的方法或模型,这为本次研究提供了意义。对四则运算应用题文本自动生成方法的研究,主要先从对四则运算表达式开始的,总结出其表达式均由最小单元复合而成。