人脸图像年龄特征深度学习与评估研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:xh287315717
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸年龄评估是预测图像中人脸的年龄信息,是一种极具发展潜力的生物特征识别技术,对建设智慧与安全城市具有重大的意义,在人机交互、视频监控和市场分析等领域都得到了广泛的应用。随着深度学习技术的发展,越来越多的研究人员将深度学习技术应用于人脸年龄评估。然而,多数基于深度学习的模型直接从人脸样本中学习单一的年龄特征用于年龄评估,导致学习到的年龄特征鲁棒性不强、易受性别、种族、环境、光照和姿势变化影响。此外,基于深度学习的年龄评估模型多数采用庞大复杂的框架,导致模型在运行时需要消耗大量内存,不便嵌入在小内存设备之上如单片机、手机和摄像头等。针对上述问题,本文从模型精简、多特征学习与融合以及3D年龄特征学习等多个方面深入探索研究如何高效地提取强鲁棒性的年龄特征,主要工作包含以下内容:(1)针对于深度年龄评估模型过于庞大问题,以及为了学习到性别和年龄特征之间的相关性,以便减少不同性别对年龄评估的影响,提出一种高效精简的深度期望年龄评估模型。基于由粗到细的特征提取原则,首先采用初步的双流卷积神经网络模型分别去提取初步年龄和性别特征,并将初步年龄和性别特征按照一定的顺序嵌合形成新的特征,再输入到细致的卷积神经网络中进而提取鲁棒性更强的年龄特征,将最后提取到年龄特征输入到回归层以求出期望年龄作为最终的估算年龄。该方法在多个数据集上进行实验,实验结果表明了该方法运行时所需的空间和时间少,且性能比一些庞大的年龄评估模型更好。(2)为了增强年龄评估模型对人脸样本性别和种族变化的鲁棒性,提出一种多特征学习与融合的年龄评估模型。首先采用三个卷积神经网络分别学习年龄、性别和种族特征,并将这些特征按维度连接,融合成鲁棒性更强的特征;然后,将融合特征输入到两种年龄评估器中,其中一个为回归年龄评估器,另外一个为排序年龄评估器,从而充分地利用年龄标签的连续性和有序性;最后,将两种年龄评估器的输出输入到全连接层中,将全连接层输出的作为最终的估算年龄,以此来自动学习两种年龄评估器的权重α1和α2。所提出的方法在多个公开的年龄评估数据集上均达到了较高的准确率。(3)为了增强年龄评估模型对光照、姿势、性别以及种族变化的鲁棒性,提出了一种基于3D人脸的年龄评估模型。通过Kinect传感器获取人脸的3D数据,3D人脸的数据存储格式为RGB-D格式,即为2D的人脸图像(RGB)和人脸的深度信息图像(D)。所提出模型首先根据深度信息图将2D人脸图像中背景噪声过滤掉;然后,将预处理之后的RGB-D图像输入到三个卷积网络,分别学习3D的年龄、性别和种族特征,并提出一种多特征自适应融合策略将多个特征融合成鲁棒性更强的年龄特征;最后,将融合特征输入到年龄评估器求出最终的年龄。在3D年龄评估数据集上进行实验验证,实验结果表明所提出模型对光照和姿势变化具有很强的鲁棒性,年龄评估达到了更高的准确率。综上所述,本文从模型精简、多特征学习与融合以及3D年龄评估等多个方面系统地研究人脸年龄评估模型,并设计相关人脸年龄评估方法,在多个年龄评估数据集上进行实验,实验结果表明本文所提出的方法可以学习到鲁棒性更强的年龄特征,取到了更高的年龄评估准确率,同时消耗更少的运算空间和时间。
其他文献
新时代下的互联网高速发展,各种数据呈现爆炸式增长。其中新闻文本数据随着推送、流媒体平台、社交媒体的普及已广泛渗透进大众生活,人们迫切希望找到有效缓解信息过载问题的方法。近年来,深度学习的发展极大地推动了自动文本摘要技术的研究。但已有的方法仍存在一些不足,面向中文语料的新闻文本摘要算法没有充分利用中文分词特征,以及摘要算法的训练目标中欠缺对整体语义相关性的考量,导致摘要连贯性较差等问题,最终影响文本
学位
实体关系抽取作为自然语言抽取领域的重要子任务,在知识图谱、搜索引擎以及智能问答等下游任务中发挥着重要的作用,根据命名实体识别和关系抽取两个子任务是否相互独立,分为流水线式抽取和联合式抽取两种方法。近年来基于预训练语言模型的联合式实体关系抽取方法取得了不错的研究进展,但仍然会出现实体重叠、关系重叠以及实体冗余等问题,同时在进行关系抽取时没有充分利用实体本身蕴含的重要信息。特别是中文实体关系抽取,由于
学位
离散事件系统(DES)是由一系列状态和事件组成的动态数学模型。随着通信和传感技术的快速发展,现代工业系统规模越来越大,系统在运行时难免会出现故障。为保证系统可靠性,控制工程师应设计一个能在正常范围内安全运行的系统,并在系统故障发生前,尽可能预测出即将发生的故障,以采取相应措施,对故障进行规避。因此,对DES发生故障前的预测问题的研究具有重要价值。随着计算机领域的快速发展,计算机集群式的算力得到大幅
学位
导数计算是包括机器学习在内的多个领域的重要需求,针对这一需求,目前存在多种不同的微分方法和实现手段。其中,基于源代码转换的自动微分由于其高效性以及适用性强的特点被广泛使用,但其实现难度较大。基于操作符重载的自动微分会导致微分的时间开销过高。基于此,本文聚焦于自动微分的实现及优化,通过追踪以及符号微分等方法与源代码转换相结合,以达到自动微分的简洁与高效实现。本文主要的研究成果包括:(1)提出了一种以
学位
特征选择就是从给定的特征集合中选出相关特征子集合以减少数据的维度。在分类任务中,特征选择不仅能够减少计算开销也能够提高分类准确率。进化算法和群体智能算法具有高鲁棒性和全局优化等优点,被广泛应用在特征选择中。在特征选择的实际应用中,不仅需要高分类率也需要较低的计算成本。基于这两个优化目标,现有的进化算法和群体智能算法大多对特征选择问题进行多目标优化,以及部分单峰优化的研究。其实,特征选择具有潜在的多
学位
根据ACE2005评测会议的定义,事件是主体状态变化或者主体间相互作用的一种客观表现,而事件抽取是从非结构化文本获取预定义类型事件的关键技术.在这些文本中,有一部分对事件发生与否作出了主观推测,且对应事件的发生时间常在未来而非过去,对此本文以未来事件进行定义.从实际应用上看,实现未来事件抽取可为未来事件图谱构建,信息检索及知识推理等后续任务提供结构化数据,同时还可以给当下决策提供参考依据.因为是对
学位
人类的生长发育等一切性状受基因和环境共同影响,其中基因广泛参与生命过程中各项生理机能的调控,对生物性状起决定性作用。甲基化作为一种常见的基因表观遗传修饰在许多生物过程与许多重大疾病的发生发展密切相关,DNA-N6甲基腺嘌呤(6-m A)表观遗传修饰是重要的表观遗传修饰标记之一。异常的6-m A位点会影响基因表达,从而引发多种重大疾病,因此预测6-m A位点对理解治病机理和治疗疾病有重要意义。基于此
学位
视频暴力行为检测任务隶属于行为识别领域,它指的是对视频序列中存在的暴力行为进行检测,传统检测方法的效率和准确率都不高,无法满足应用需求。随着深度学习技术的快速发展,基于深度学习的检测方法与传统方法相比在准确率上有了很大的提高,因此基于深度学习的暴力行为检测方法近年来得到了一定程度上的发展。虽然基于深度学习的检测模型准确率很高,但其效率仍然较低,不能应用于实时暴力行为检测场景。基于深度学习的检测模型
学位
人脸年龄合成包括人脸的老化和逆龄化,其目标是基于输入的人脸图像对指定年龄阶段的面部形态进行预测。该技术具有重要的应用价值和广阔的发展空间,一直是计算机视觉领域的研究热点。近些年,在深度学习理论的推动下,人脸年龄合成技术取得了突破性进展。但由于人脸的老化现象较为复杂且受到多种因素影响,现有算法难以兼顾人脸图像的面部轮廓和纹理变化,且无法细粒度建模人脸的连续老化现象。此外,随着人脸年龄合成要求的不断提
学位
随着大数据时代变革的逐步推进,也因为在需要对对象进行多种不同视角特征的描述上更具有优越性,多视角聚类分析法获得了更多的研究重视。相比于简单连接所有视角特征的单视角聚类,能够分别处理每个视角特征的多视角聚类可以联合优化每个视角,从而能尽可能地利用每个视角特征提高最终的聚类效能。多个视角的数据特征内包含着丰富且互补的信息,联合优化多个视角的数据特征能够更好地去探究数据的内在结构关系。如何能够更好地结合
学位