基于深度学习的跨年龄人脸识别

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:missyouangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨年龄人脸识别作为通用人脸识别研究的细分方向之一,在金融、安防监控、智能手机应用等诸多领域都具有重要的应用价值。跨年龄人脸识别由于受到人脸皱纹随着时间变化而加深、颅骨形状改变等因素影响,比通用人脸识别任务难度更大,识别准确率也相对更低,并且由于跨年龄人脸识别研究较通用人脸识别而言起步晚,现有的方法也相对较少。鉴于此,本文针对跨年龄人脸识别问题展开更进一步的研究。首先,鉴于ResNet50网络模型在通用图像特征提取方面体现了良好的特征提取效果,本文借助ResNet50网络模型,通过引入可变形卷积和空洞卷积给出了适合跨年龄人脸识别的基于改进ResNet网络的端到端跨年龄人脸特征提取模型。在此基础上,将该特征提取模型与余弦相似度相结合,形成了性能较好的基于端到端人脸特征提取模型的跨年龄人脸深度学习识别方法。实验结果表明,该方法具有较好的跨年龄人脸识别准确率。其次,鉴于孪生网络思想有助于提升类内聚合与类间分离效果,本文将孪生网络架构与上述改进后的特征提取模型相结合,来进一步提升该特征提取模型的特征表征性能,并进而结合余弦相似度进行相似性度量,形成了基于孪生网络架构的跨年龄人脸深度学习识别改进方法。更进一步,结合多元孪生网络与关系度量思想,在给出基于多元孪生网络结构的跨年龄人脸深度学习识别方法的基础上,进一步形成了融合多元孪生关系度量的跨年龄人脸深度学习识别方法。实验结果表明,基于孪生关系度量思想的上述方法具有更好的跨年龄人脸识别效果。
其他文献
图像的非真实感渲染是计算机图形学领域的一个重要研究方向,其具体的含义是指利用计算机来模拟各种视觉艺术的风格,从而绘制出带有艺术风格的图像。卡通风格也是一种图像艺术风格,伴随着近年来新媒体艺术的兴起和社交网络的流行,大众对于个性化卡通风格图像的需求日益增长,对于图像卡通风格渲染算法的研究具有重要的意义。图像卡通风格渲染是一项具有挑战性的图像非真实感渲染任务,其目的是将真实照片转换为卡通风格的非真实感
近年来,随着模式识别技术和计算机运算速度的快速发展,越来越多的深度学习技术被应用于各个领域。而基于深度学习的唇读技术也因其出色的识别性能受到了国内外学者的广泛关注。研究唇读的目的是利用嘴唇图像序列的视觉信息来补充语音等听觉信息,进而提高计算机系统对语言的理解能力。嘴唇图像分割有利于自动化提取嘴唇轮廓等信息,直接影响后续说话内容识别模块的性能。因此,实现精确的像素级嘴唇区域图像分割对唇读技术的应用具
得益于硬件计算能力的提升,深度神经网络越来越广泛地应用于计算机视觉任务中。为了提取更多的特征,提高网络的鲁棒性,神经网络呈现出层数越来越深,参数量越来越大的特点。桌面级GPU如NVIDIA 1080Ti完全可以训练和部署大型网络。但是移动设备如智能手机、无人机有着算力弱、带宽小、存储空间少的特点,使得大型的深度学习模型在其上部署面临很大挑战。因此将模型压缩后使其在资源受限的硬件平台上有效部署成为了
近年来,AI技术逐渐产业化。一直备受关注的计算机视觉领域的成果在商品识别、智能安防、智慧城市等领域纷纷落地开花。人脸识别、行人检测、行人重识别、行人搜索等技术与安防领域的实际需求十分契合,也因而得到了越来越多的关注。本文在各种经典计算机视觉任务模型的基础上,对行人搜索技术在实际应用中十分典型的一体化搜索场景和严重非对齐搜索场景进行了分析,并提出了相应的模型与算法。一体化行人搜索场景是指行人检测与行
随着移动设备与互联网的发展,图像数据的使用愈加普遍,对于图像数据进行提炼与表达,即对图像的特征学习也越来越受到人们的重视。对于图像任务,模型的表现很大程度上取决于特征的好坏,良好的特征使得模型更容易提取有效的信息。传统的特征提取方法往往需要手工提取且效果较差,基于深度学习的特征提取方法往往效果较好,但是特征的含义难以理解。目前大多数的特征学习模型采用有监督学习,而本文将使用无监督学习的方式研究如何
散射成像是一种将携带目标信息无序散斑通过后处理算法恢复散射介质后目标图像的技术,散射成像在大气成像、生物组织成像和水下成像等方向都有非常重要的应用前景。散射介质破坏了传统光学成像中的光子直线传播路径,光子的传播方向在散射介质中会被多次随机改变,探测器得到的数据是目标信号被随机改变后的散斑。不仅散射介质会影响成像,光的强弱也会影响成像过程。在弱光下,光信号更多呈现出光的粒子特性。传统的探测器无法应对
得益于深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)的发展,大量计算机视觉任务取得了传统算法难以达到的表现。但是,由于大量冗余特征的存在,这些基于DCNN的优秀模型会消耗大量有效的存储和计算资源,通常难以部署在资源受限的平台。如果我们能够用一组正交的特征来表示所有特征,则可以用一个轻量级小网络来代替复杂卷积神经网络,且不带来任何精度损失。因此,在
疾病是威胁人类健康的主要因素之一,其中糖尿病和胃癌是对中国人危害最大的两种非传染性疾病。有研究指出,经早期诊断后及时治疗,不仅能降低这些疾病带来的痛苦,还能增加治愈率和存活率。电化学是研究电现象和化学现象之间相互转化的科学,电化学生物传感器具有特异性好、重复率高、稳定性好、实验操作过程简单等优点,现已被广泛研究于生物医学工程领域中。而金属纳米材料大多具备良好的导电性,且易被化学或生物修饰处理,近年
随着互联网的高速发展,各种信息资源呈现井喷趋势,仅仅依靠搜索引擎已经难以为用户提供优质的信息服务。为了缓解信息过载问题,各大公司纷纷构建推荐系统,为用户提供精准的个性化推荐服务。在一些网站上,用户可以随意为喜欢的物品打上社会化标签,这些标签不仅可以反映用户的偏好和态度,也折射出物品的内在属性。因此,标签感知推荐系统将这些协同行为产生的社会化标签作为一种内容信息,为用户提供个性化的物品推荐。为了解决