基于卷积神经网络的多任务跨域人脸属性识别

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kekedehome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于我们人类而言,拥有着复杂结构以及丰富细节等特点的人脸是十分重要的生物特征之一,它能够表达出众多的属性信息,来帮助我们在日常生活中进行无需言语的沟通交流。人脸属性包括年龄、性别、种族、表情等生物特征,利用机器学习的方法来识别出各自不同的属性特征即为人脸属性识别算法。现在主流的图像分类算法多采用了基于卷积神经网络的深度学习方法,但对于高度相似且数据繁多的跨域人脸属性识别问题却仍面临着挑战。为了解决上述问题,本文提出了一种基于卷积神经网络的跨域多任务人脸属性识别方法,其中,跨域是指能够在非限定条件下在跨数据集数据中同时识别出不同种类的人脸属性信息,并在摄像头拍摄中达到了实时检测的效果。该方法主要包括双线性高效注意力网络(Bilinear Efficient Attention Networks,BEAN)结构、改进后的人脸特征提取网络以及多任务学习三个部分。本文主要工作内容如下:针对人脸属性高度相似且类内差距大、类间差距小等特点,本文提出了双线性高效注意力网络算法,选择了一种高效的ECA(Efficient Channel Attention)模块来代替SE模块实行卷积神经网络之中的注意力机制,并利用双线性结构帮助网络均衡化不同阶层的信息。实验表明,该网络结构在每个待分类的人脸属性数据集之上都有着良好的性能,且每种属性分类结果与传统的卷积网络结构对比都有着显著的提升。为了进一步提升网络的性能,增强网络对外界条件变化的鲁棒性,本文从光照变化校正和几何变化校正两个方面入手,提出了Gamma自动光照校正以及融合Gabor滤波器两种方法,对BEAN中的人脸特征提取网络进行改进。实验表明使用了Gamma自动光照校正后能够有效提升识别的精度,同时结合改进后的Gabor卷积层算子,能够进一步提升BEAN对人脸属性识别的性能。针对现实生活中存在的人脸属性数据集冗杂、样本不均衡以及标签缺失等问题,本文提出了一种基于跨域多任务学习的人脸属性识别方法,通过基于半监督的数据集集成方法形成一个具有统一输入与标签格式且样本均衡的人脸属性数据集,并对BEAN的结构进行改进,实现了跨域多任务人脸属性识别问题。实验表明,该网络模型有较好的精度效果,在本文集成的数据集上,性别、种族以及表情类别,分别达到了94.15%、85.92%和83.91%的精度,在年龄分类任务中,平均绝对误差减少到了4.89。
其他文献
导弹阵地作为防空反导系统中重要的组成部分,对其进行侦察、定位和识别具有重要理论意义和军事应用价值。光学遥感影像具有分辨率高、成像幅面宽等优点,被广泛应用于目标侦察识别领域。论文以可见光遥感影像中导弹阵地内发射场坪、发射掩体和制导场坪三类子目标的检测识别为研究对象,构建了知识驱动和数据驱动的两类目标检测识别方法,力图解决现有算法应用于大幅面遥感影像时存在的“误检多”和“效率低”两个难题,实验证明了所
学位
在无人机GPS信号拒绝的工况下,视觉导航作为新型的辅助导航系统。因为视觉导航算法自主性强,能高精度且高效率的完成辅助导航任务,而被广泛采用。其中基于特征匹配的无人机视觉辅助导航定位技术所需设备简单、定位精度高,能与惯性系统组合构成完全自主的高性能无人机导航定位系统而具有重大的研究意义。然而,当前的图像特征匹配算法具有不稳定,时耗高,鲁棒性差的问题。本文对已有图像特征匹配算法进行了深入地研究,并提出
学位
随着航天技术的发展,太空成为了各国的必争之地。2016年中国航天白皮书明确指出,中国永久性空间站将于2022年前后建成并投入使用。空间站是我国的航天重器,因此必须要保证空间站的安全与正常运行。本文以挂载在空间站上,可以脱离空间站运动,并且具有维修空间站与识别航天器功能的巡视器为载体,研究航天器的识别与空间站的位姿估计。航天器的识别是保障空间站安全的前提,空间站的位姿估计是巡视器与空间站交会对接、巡
学位
在义务教育阶段语文学科的四大核心素养中,语言运用是思维能力、审美创造、文化自信的基础,其重要性不言而喻。其中口语表达与交流是语言运用的主要组成部分,也是当前初中语文教学的主要内容之一。但在现阶段的语文教学中,学生的口语表达普遍存在不善言辞、词不达意、言之无序等问题,且目前对初中语文口语表达与交流教学的研究较少,缺少具体明确的、有针对性的教学策略。因此论文以初中生的口语表达与交流能力为研究对象,着力
学位
心脏CT医学影像用于临床诊断心脑血管疾病具有重要意义。使用计算机断层扫描(CT)或其他成像技术获得精确的全心分割在心脑血管疾病的治疗中起着重要的作用。由于医生手动分割在面对海量医学图像数据时比较低效,因此借助深度学习技术中的神经网络通过多次学习图像特征,能够快速、准确的完成心脏自动分割任务具有重大意义。本课题将心脏CT图像分割算法作为研究对象,基于经典分割网络3D Unet提出一种新的3D深度监督
学位
高维多目标优化问题是指同时优化三个以上目标的问题,广泛存在于实际应用中。演化算法拥有良好的全局搜索能力,在目标维数较低时有较好的求解性能。目标数量增多时,搜索空间变大,演化算法在求解过程中难以兼顾收敛性和多样性,导致求解效果不佳。因此,设计具有良好求解效果的高维多目标演化算法具有重要意义。环境选择是演化算法的重要组成部分,作用是选择适应度较好的个体参与演化。设计合适的环境选择策略可以平衡种群在演化
学位
鱼雷具有隐蔽性高、射程远、威力大等优点,一直是海军装备中的核心武器。常规鱼雷发射速度约30m/s,在入水过程中可能出现器件失灵、跳弹和沉底等现象。目标检测与跟踪技术可以提供弹体姿态、位置、速度等信息,是支撑鱼雷入水稳定性研究的基础数据,因此设计高精度弹体检测与跟踪算法具有重要意义。传统的弹体位置数据是通过相机软件人工标记或传感器检测得到,实时性差且成本高。随着计算机视觉的发展,目标检测与跟踪技术为
学位
随着信息技术的高速发展,我们在享受互联网带来的便利时,也需要应对信息使用效率低的难题。面对海量的信息,性能良好的个性化推荐算法可以让用户快速找到自己感兴趣的内容,为企业带来巨大的经济效益。推荐系统数据集是基于用户的点击行为所收集的数据。在点击数据的采集过程中,由于误触、被夸张的标题或者图片吸引产生了大量的“假数据”,限制了模型的推荐效果。实际应用中能够采集到的用户行为数据是有限的,基于协同过滤的推
学位
随着大数据时代的不断发展,数字化、信息化已经成为国民经济发展的重要增长点,国企作为国民经济的支柱产业,已经随着时代浪潮逐步进入深化改革、不断演化发展的进程,国企管理升级的举措也日渐与国际接轨,财务部门作为管理机构也逐步实现了“六者定位”的转变,但单一传统的账表分析及呈现方式已不能满足当下管理层对转型后财务管理工作的要求。Tableau作为一款多功能快速分析、可视化并能分享信息的软件,它能生动地帮助
期刊
目标跟踪是实现智能化视频应用和智能决策的关键环节,对视频监控、智能交通、和人机交互中的运动捕获等应用都具有重要意义。但是在各类应用场景的长视频中,目标存在表观变化和反复遮挡,如何持久稳定地跟踪目标成为了亟待解决的问题。本文针对自然场景下长视频的目标稳定跟踪问题进行研究,主要的工作如下。(1)针对长视频中跟踪目标表观变化和遮挡后重捕获问题,设计了一种基于标注帧特征融合的目标跟踪方法。该方法采用基于检
学位