融合噪声标签学习与多任务学习的人脸美丽预测应用研究

来源 :五邑大学 | 被引量 : 0次 | 上传用户:maomao820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸美丽预测是研究让计算机具有人脸美丽判断能力的前沿课题,可应用于医学整形美容、社交网络推荐、人脸图像美化、人物原型设计等多个领域。目前,人脸美丽预测仍存在监督信息不足、模型易受噪声标签影响等问题。噪声标签学习可通过建立噪声模型、设计损失函数或者正则化器等方法,来降低人脸美丽预测中噪声标签的影响;多任务学习能利用多个人脸美丽预测相关任务的有效监督信息,来提高人脸美丽预测的准确率。将噪声标签学习与多任务学习相融合,不仅能利用多任务监督信息来解决人脸美丽预测监督信息不足的问题,而且还能降低人脸美丽数据库中噪声标签的影响。因此,本文提出融合噪声标签学习与多任务学习,并应用于人脸美丽预测,研究内容主要包括:(1)深度卷积神经网络应用于人脸美丽预测,存在过度拟合噪声标签样本问题,从而影响深度卷积神经网络的泛化性。为此,本文提出一种自纠正噪声标签方法应用于人脸美丽预测,可降低噪声标签的负面影响。该方法采用自训练教师模型机制和重标签再训练机制。其中,自训练教师模型机制以自训练的方式获得教师模型,帮助学生模型进行干净标签对应样本的选择和训练,直至学生模型泛化能力超过教师模型而成为新的教师模型,并不断重复该过程;重标签再训练机制通过比较最大预测概率和标签对应预测概率,来纠正噪声标签,并利用纠正后的数据反复采用自训练教师模型机制。实验结果表明,该方法在人工合成噪声标签条件下可降低噪声标签的影响;同时,大规模亚洲人脸美丽(Large Scale Asia Facial Beauty,LSAFB)数据库、SCUT-FBP5500数据库的预测准确率高于常规方法准确率,具有选择干净标签样本、充分利用全部数据的特点。(2)多任务注意力网络(Multi-Task Attention Network,MTAN)能利用单个数据库的多种标签类型数据进行监督训练,但忽略了多个仅有一种标签类型的数据库进行多任务训练时效果不佳的问题。为此,本文结合多任务注意力网络,提出双输入双任务注意力网络(Dual-Input Dual-Task Attention Network,DIDTAN)。该网络将MTAN中任务共享的批量归一化层(Batch Normalization,BN)扩展为不同任务特定的BN层;通过引入神经辨别性降维(Neural Discriminative Dimensionality Reduction,NDDR)模块来约束浅层特征表达;同时,使用深度相关对齐(Deep CORrelation Alignment,Deep CORAL)损失函数约束全连接层特征表达。基于LSAFB数据库、SCUT-FBP5500数据库、Celeb A数据库的实验结果表明,使用双输入双任务注意力网络能提高人脸美丽预测准确率,且高于基准方法;此外,同时利用两个单标签类型人脸美丽数据库的监督信息,解决了监督信息不足的问题。(3)双输入双任务注意力网络通过利用两种输入数据的监督信息,解决了监督信息不足的问题,但网络模型仍易受噪声标签影响。重标签再训练机制是通过比较最大预测概率和标签对应预测概率,来纠正噪声标签;再利用标签纠正后的数据重新进行模型训练,有效降低了噪声标签的影响。因此,本文将DIDTAN融入重标签再训练机制,构建了重标签再训练机制融合模型,使其不仅能利用两种输入数据的监督信息,还可降低噪声标签的影响。实验结果表明,基于LSAFB数据库、SCUT-FBP5500数据库的双输入双任务人脸美丽预测取得65.4%的预测准确率,高于常规方法。
其他文献
在过去的20年里,人们对教师信念的研究兴趣大增。推动这一研究增加的关键在于人们认识到教师是积极的决策者,在课堂活动中发挥着核心作用,且他们的行为受到教师信念的指导。理解教师信念是理解教学过程的核心,同时可以帮助教师更好地理解自己。目前对教师信念的研究主要集中在在职教师身上,大多数是通过问卷调查进行的定量研究。然而,教师的信念是内隐的、不可言喻的,因而教师的回答不一定是真实的。基于此,本研究采用个案
学位
百年初心历久弥坚,2021年教育部进一步要求将革命传统全面融入中小学课程教材,在《革命传统进中小学课程教材指南》(教材[2021]1号)中明确要求统编本初中语文教材突出加强革命传统教育,厚植红色基因,落实立德树人。初中生正处世界观、价值观、人生观的塑造期,社会经验和认知水平有限,亟需教师引导他们树立正确的是非观,建立起应有的文化认同感及民族使命感。传统的“革命传统”选文教学因时代背景久远、价值潜隐
学位
报纸
本文主要研究了几类非线性复微分差分方程的解.同时给出了相关的例子,进一步说明解的存在性.本文的结构安排如下:第一章是绪论.介绍关于非线性复微分差分方程研究的背景以及现状.第二章是准备工作.主要介绍了Nevanlinna理论等在本文需要用到的基本概念和证明过程中要用到的部分引理.第三章研究了一类非线性微分方程的超越整函数解,得到了定理3.1,推广了柏雪在文献[13]的结果;第四章研究了一类非线性微分
学位
首先,我们从脉冲控制的观点出发,建立关于任意时滞的脉冲微分不等式.其次,利用此不等式与Lyapunov(李雅普诺夫)方法等研究了具有任意时滞的神经网络的脉冲μ-稳定化,以及驱动-响应系统的脉冲μ-同步化.最后,运用矩阵张量技巧和线性矩阵不等式等方法研究了具有任意时滞的复杂网络的脉冲μ-同步化问题.内容如下:第一章,介绍了研究脉冲时滞微分系统的稳定与同步目的与意义及国内外研究现状.第二章,从脉冲控制
学位
本硕士论文主要研究四元数双曲空间的若干性质.我们研究了球模型与Siegel域的极限球面之间的对应关系、两个偏差定理、球模型中极限球与正则域相交的充要条件等内容.本文结构如下:第1章,介绍四元数双曲空间的研究背景.第2章,通过四元数双曲空间的球模型,引入四元数双曲空间的另一模型Siegel域,得到了Siegel域上的Busemann函数与等距球的相关性质.接着在Siegel域上引入极限球坐标与Cyg
学位
众所周知,一个矩阵只有当它是方阵而且非奇异时才有逆矩阵,或者当它的列(或行)是线性无关时才有逆矩阵.而对于任意多个非奇异矩阵Ai,i=1,2,…,n,以下反序律成立:(A1A2…An)-1=An-1..…A2-1A1-1.这种反序律对于任意多个矩阵乘积的广义逆来说不一定成立.20世纪60年代以来,很多学者研究了矩阵乘积广义逆的反序律理论及其应用,其中包括了矩阵乘积Moore-Penrose逆以及D
学位
在近些年来的脑科学的研究当中,关于大脑疲劳形成在背后所蕴藏的神经科学机理,一直是当前的热点研究方向之一,由于驾驶疲劳所导致的交通事故伤亡,引起了人们对驾驶疲劳检测的高度重视,本文针对以往疲劳检测模型中的不足,提出了一种新的基于注意力的多尺度卷积神经网络,即动态图卷积网络(AMCNN-DGCN)模型,该模型能够很好的发挥图卷积对非结构化数据提取特征的能力,并结合动态调整的邻接矩阵,获得更加优异的分类
学位
随着图像处理技术的发展,舌诊客观化成为当今人工智能医工交叉领域的热点内容。为使中医舌诊更加客观定量化,图像处理技术与深度学习已应用于舌诊客观化。因此,基于深度学习的舌诊图像处理方法成为了必然的研究方向。目前,舌诊图像分割分类技术面临着复杂环境下的分割结果不佳,分类标记数据样本不足以及类别不平衡的问题。针对以上舌诊图像分割分类任务中面临的难点问题,本文以深度学习框架为基础,结合编解码网络、注意力机制
学位
金属制品在工业生产过程中,常常会由于各种因素受损,产生缺陷。过去,企业往往采用人工检测的方法进行筛选,该方法工作量大,检测速度慢,无法满足实际需求,而基于机器视觉的表面缺陷检测技术能够克服人工检测的缺点,已成为工业生产线中的关键检测技术。然而,传统机器视觉检测算法步骤繁琐,通用性差,且容易受到光照,阴影等环境条件的影响,其人工设计的特征更是存在着较大的局限性,难以应对复杂多样的金属表面缺陷。随着人
学位