基于深度学习的非受控场景下人耳检测和识别

来源 :北京科技大学 | 被引量 : 7次 | 上传用户:huazi8527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人耳识别技术是生物特征识别领域最常见的识别技术之一。相较于其他生物特征,人耳具有其独特的优点。人耳不受表情、年龄影响,并且人耳数据采集过程可以无需被采集对象的配合。一个鲁棒的人耳识别系统在诸多方面,例如门禁管理、智能手机应用、法律实施与刑事侦查等都有着巨大的应用潜力。经过学术界多年的研究,人耳识别技术已经取得了长足的进步。现有的人耳检测和识别算法在一些常见的受控场景下建立的人耳数据库上能够取得很好的效果。但是研究者也发现,现有的人耳识别和检测算法在非受控场景下的性能会急剧下降。在实际应用中,采集到的人耳图像同时受到姿态、光照和遮挡等一种或多种干扰因素的影响的情况很常见。所以,非受控场景下的人耳检测和识别是一个非常有挑战性而又亟待解决的问题。近年来,深度学习在计算机视觉领域的发展令人瞩目。在一些生物特征识别领域也获得了巨大成功。但是相较于人脸识别,指纹识别等领域,人耳识别领域因为缺乏足够训练数据以及CNN网络设计研究,导致发展相对缓慢。针对这样的问题,本文进行了以下四个方面的研究:1)建立了两个非受控人耳数据库,分别可用于人耳检测算法和人耳识别算法的模型训练和测试。其中USTB-WebEar数据库中图片来自于网络,具有背景复杂,人耳干扰多样性的特点,满足非受控场景人耳检测的训练和测试要求。另外,本课题还建立了另一个大规模非受控场景下人耳数据库USTB-Helloear数据库,并设定了一系列训练和测试的规则。该数据库无论从个体人数和总数据量上均可以满足大规模深度模型训练和测试的要求。2)提出了一种基于多尺度 Faster R-CNN(Faster Region-based Convolutional Neural Networks)算法的人耳检测算法。该算法针对原始的Faster R-CNN算法中仅依靠设定匹配分数阈值来确定最终人耳检测结果的策略在实际应用中鲁棒性不足的缺点,提出了一种融合人耳形态特征和位置上下文特征的多尺度检测算法,并结合了所提的ERF算法来最终确定人耳区域。实验结果表明,所提算法相较于原始的Faster R-CNN算法和AdaBoost算法,在三个代表性的数据库上均表现更为优异。3)针对人耳识别任务特有的性质和特点,对传统CNN模型进行了一系列的改进和整合,提出了VGG-Ear模型。该模型结构的最后一层池化层为SPP层,使得输入的图片尺寸可以是更适合人耳形状特点的自定义尺寸,并在该层获得了融合整体和局部的人耳特征。在训练阶段,使用了 Center Loss和Softmax Loss作为联合监督信号,使得训练获得的人耳特征更加紧凑和空间可分。最后,使用不同尺度的人耳图片训练得到的三个模型进行了整合,最终获得了一个多尺度的人耳特征表示。本文所提的VGG-Ear模型在USTB-Helloear数据库、AWE和CVLED数据库上的人耳认证和识别准确率有了不同程度的提高。4)针对非受控场景下人耳在受人耳大姿态变化以及遮挡影响时,模型性能下降问题,本课题提出一种基于级联CNN网络的人耳关键点定位算法。通过由粗到精的定位人耳上6个关键点,并通过与标准耳进行对齐并分割而实现了人耳姿态和位置的标准化。通过使用标准化处理后的人耳图片在相同的数据库上训练和测试实验对比,证明所提人耳标准化算法可以显著提高CNN模型的人耳特征表示能力。本课题通过建立大规模非受控场景人耳数据库,设定测试标准,并提出基于深度学习的人耳检测,人耳关键点检测和人耳识别认证算法,在人耳识别领域从无到有的建立起一套完整的基于深度学习的端到端的人耳识别认证方法。该研究不仅对非受控场景下的人耳识别具有重要的研究意义,并且对于类似的其他生物特征识别或者图像识别、模式识别领域的研究也具有参考和借鉴价值。此外,本课题所提出的面向实际应用场景的一系列算法对于解决现实中诸如智能安保、智能手机应用、公安机关破获刑事案件等问题中具有理论指导意义。
其他文献
今年1月《中国当代艺术史1978—2008》迎来了第3次印刷,海外版版权也在积极洽谈中。一本看似只有专业人士才会研读的"厚重"学术书如何才能畅行在学生、大众读者和美术研究者
大力发展职业教育和改革中等教育结构,是80年代以来中国教育改革的两个重要方面。在这两大改革的共同作用下,职业中学以前所未有的速度迅猛发展,地处改革开放前沿的珠江三角
语言教学是幼儿园的重点教学项目之一,在幼儿园阶段如何进行有效的语言教学是目前幼儿园语言教学面临的重要难题,教学既要符合幼儿成长规律,又要幼儿对教学内容感兴趣,幼儿由于年
目的观察益气活血解郁法对中晚期肺癌患者焦虑、抑郁状况及细胞免疫功能的影响。方法将60例中晚期肺癌患者随机分为2组,对照组30例采用培美曲塞+顺铂化疗方案治疗,并给予盐酸
如果历史可以重演,那么从2007年12月始的本轮金融危机可能止步于2009年5月。而在下半年世界经济企稳并走强之时,有可能正是美元的下行之日。
推进党内民主应强化制度功效并力求制度创新。从与时俱进的视角看,党的十七大报告提出要实行党的代表大会代表任期制、推行地方党委讨论决定重大问题和任用重要干部票决制、选
《浙商》记者结合浙商的投资隋况,分析解读辽宁省未来几年重点发展的产业,以及其中蕴含的商机。
鹰潭信江大桥主梁为“雄鹰展翅”造型,翼缘板挑臂长度达4m,常规挂腿式前支点挂篮无法应用于这种结构形式的施工.本文详细介绍了鹰潭信江大桥挂篮的设计及施工操作流程.
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
在管理实践中发现,敬业度高的员工愿意全身心地在企业中发挥个人的最大价值,对组织绩效会产生积极的正向影响。在员工敬业度高的企业,员工发自内心地认同和恪守公司价值观。