基于深度神经网络的人脸属性识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:eeeeeedddddd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,全国各大中小城市已经布满了各种型号的监控摄像头,海量的监控图像极大丰富了人脸以及行人分析任务的应用场景。在此背景下,研究智能视频理解技术,让计算机实现突发事件的准确预测和快速响应,已成为安防领域的核心需求之一。在视频监控领域,行人是主要的监控对象,人脸属性作为面部的重要信息被广泛的应用在人脸识别和人脸检索等任务中。人脸属性识别定义为给定一张人脸图像,经过特征提取,预测出一系列外观属性。根据属性的描述范围,可以将属性分为全局属性和局部属性,对于局部属性首先应定位出局部区域,使用局部特征来提升属性识别精度。此外,在实际应用场景下,由于受到拍摄条件和相机质量的影响,监控摄像头拍摄的图片多为低分辨率图片,这种图片缺少面部细节特征,所以常规识别方法无法有效地处理低分辨率图片。针对以上问题本文的主要研究内容如下:(1)提出了基于弱监督局部区域定位的人脸属性识别网络。本文在该网络中设计了一个属性定位模块(Attribute Localization Module,ALM)。与现有的方法不同,ALM仅利用图像级别的属性标注就可以关注到属性存在的局部区域,并利用局部区域的特征来改善面部属性识别效果。此外,本文还引入了自下而上跳跃连接(Bottom-up Skip Connection)的结构以融合多个卷积层的特征,通过将底层细节特征融合到顶层语义特征中可以提高属性区域定位的准确性。(2)为了解决低分辨率属性识别问题,本文提出了一个端到端的多任务生成对抗网络(Multi-task Generative Adversarial Network,MTGAN),其中生成器是一个超分辨率网络,主要负责将低分辨率图片上采样到一个合适的尺度,并恢复出细节信息。判别器是一个多任务网络,负责分辨输入的图片的真假,以及对人脸属性进行预测。在训练过程中,判别器的属性识别损失也会反向传播到生成器,引导其恢复出有助于属性识别的细节特征。(3)本文收集了一个人脸多属性数据集(Face multi-attribute dataset,FMAD),该数据集中的图片均由监控摄像头在真实场景下进行拍摄。共包含17756张图片,每一张图片标有13个属性。为了高效而准确的进行标注,本文还开发了一款属性标注工具,该工具操作简单、界面友好、可拓展性强。
其他文献
三维重建是包括机器人导航、目标识别、场景理解、动画制作、工业控制、医疗诊断和自动驾驶在内诸多领域所需的核心技术,而深度和光流信息是重建真实三维场景的必备条件。早期方法针对深度或光流进行单独估计,近年陆续出现联合估计深度与光流的不同方法。但联合估计方法依然在泛化性、准确性、完整性等方面存在不足,严重制约该领域进一步发展。因此,为了得到更高精度的深度信息与光流信息,本文提出了一种新的双目深度与光流联合
交通事故是全世界最严重的危害之一,其造成了巨大的财产损失和人员伤亡,其中约95%的事故是由驾驶员不当行为造成的。检测公交车驾驶员异常行为能够对驾驶员的不当行为进行预警,从而保障交通安全。在2019年末爆发的COVID-19中,驾驶员作为公交车上与流动性人员接触最频繁的人,对其佩戴口罩行为进行检测,能够有效降低感染风险,保障其自身和广大乘客的健康安全。实时监测公交车驾驶员,对其不当行为进行及时提醒,
我国制造业正处于向“智造业”转型关键时期,这其中缺陷检测环节必不可少,因此应用现代化机器视觉技术替代耗时耗力的人力工作,是一个重要研究内容。而今在机器视觉领域,深度学习逐渐在一些应用中取代传统视觉算法。但是,根据目前深度学习的发展现状,大量的有效数据是具体应用的必要前提,也是由于这个原因,少样本学习问题是很多场景中面临的最现实的问题。本文的研究课题来源于江西一家生产轴承滚子的企业,针对该企业生产产
近年来元学习问题及其相关应用逐渐成为国内外关注的研究课题,它通过训练模型“学会学习”来提高数据效率、迁移先验知识、节约计算资源等,在少样本学习、强化学习等问题上都有良好的应用前景。当前有诸多不同类型、设计思路的面向元学习的计算策略不断提出,因而如何对元学习问题进行系统的建模以及方法的归纳显得尤为重要。本论文通过引入动态系统以及最佳响应理论,帮助重新建模元学习问题的数学模型,提出一个通用的双层优化统
由于心血管疾病的高致病率和高死亡率特性,它已成为危害人类健康和生命的“头号杀手”。对心血管疾病进行有效诊断和预防尤为重要。近些年,随着深度学习理论和技术的快速发展,借助深度学习对心电图进行特征分析以及病症分类已成为智能医疗健康领域研究的热点问题。但是针对于临床应用,依然存在很多实际问题需要解决:如心电图采集和传输过程中出现各种噪音干扰、缺失;大多数研究都是针对于单导联或是双导联心电图信号进行分类,
近年来,三维深度学习的研究已成为热点,它在自动驾驶、机器人等领域中都得到了广泛的应用。现阶段研究中三维模型数据集样本数量有限,规模无法与二维数据集相比,这也是困扰绝大多数研究者的问题。深度学习任务中数据集的匮乏会直接导致模型的性能出现瓶颈,数据增强技术就是为了应对这个问题而被提出的。在三维点云深度学习领域中,对于数据增强技术的研究还不多,本文主要研究三维点云数据的数据增强算法,提出的方法可以从源头
随着机器学习和人工智能等学科的发展,越来越突显出数据的重要性。个人或企业每天会产出或者收集大量的数据,数据的抓取越来越便捷,但是数据质量也逐渐引起人们的重视。其中数据缺失问题常常发生,甚至难以回避。实现算法或提供可靠的决策分析等都依赖于高质量的数据,因此数据填补是一项重要研究内容。本文首先基于自联想神经网络(Auto-Associative Neural Network,AANN)对不完整数据进行
近年来随着生活水平的显着提高,人们对移动式电子设备的性能提出了更高的要求。作为芯片的核心单元,中央处理器(Central Processing Unit,简称CPU)变得越来越重要。但是,一方面由于MOS晶体管达到了物理极限,另一方面由于以ARM等公司为代表的CPU厂商收取越来越高的专利费,CPU的发展进入了瓶颈期。RISC-V(Reduced Instruction Set Computer f
声音作为人类感知周围事物的重要媒介遍布在人们生活的各个方面,其中往往包含着重要信息辅助人们进行抉择。声音事件检测(Sound Event Detection,SED)是指将采集到的音频数据进行分类,并判断当前发生的事件或所处的场景,其在无人驾驶、智能家居、安全监控等领域有着广阔的应用前景。近年来,随着深度学习技术在各个领域的不断发展,使用神经网络替代传统音频识别的方法已经成为越来越多研究人员的选择
随着智慧城市理念逐渐成熟以及技术日益发展,智能交通成为了智慧城市中极其重要的一环。由于国家新能源政策的普及与绿色出行观念的流行,城市居民出行的方式更加倾向于非机动车。然而非机动车使用率的攀升以及对行人管理条例的不完善引起一系列交通违规,这些违规行为引发了大量的交通事故。如何对违规行为的治理科学化、常态化已经成为城市交通网络中亟需解决的难题。本文在解决上述实际问题的过程中,采用了深度学习的方法,提出