融合结构先验信息的人脸图像修复网络的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:Elmo761129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的图像修复方法,主要针对自然场景、建筑物等图像,对于人脸图像的修复并没有过多的深入研究。自然条件下的人脸图像的修复,会随着人脸姿势、遮挡、表情等因素而造成修复结果产生偏差,比如出现边界区域模糊、结构不连贯等问题。本课题着重关于人脸图像的修复展开研究,提出了基于人脸结构特征先验引导的图像修复算法,该算法通过在残缺人脸图像中使用卷积神经网络提取人脸结构潜在信息,然后通过人脸结构条件约束和重建隐藏层内容约束来进一步提升重建后的图像结果,本文主要工作如下:
  首先,针对残缺人脸图像标志点检测问题,分别基于VGG16和MobileNet-V2为骨干网络进行残缺人脸标志点检测网络的构建,并提出了基于特征融合的标志点检测网络。残缺人脸图像经过卷积层进行特征提取,在进行标志点预测之前,将不同层的特征进行融合,实现不同尺度上有效信息的整合,从而提高标志点的检测精度。
  其次,为了提高人脸图像修复结果的结构细节,将人脸标志点结构先验信息嵌入人脸修复网络。与自然场景相比较,人脸图像具有较强的拓扑结构一致性。对于残缺待修复图像预先预测出其对应的人脸标志点特征图,并将其作为先验信息来引导图像修复网络的训练,同时为了优化重建网络,加入扩张残差,在提取更深层次特征信息的同时保证特征的分辨率,为后续的重建工作做准备。
  最后,为了优化图像重建子网络,提升图像修复的质量,提出了基于深度监督的分支网络。通过对重建子网络的中间隐藏层特征添加软约束,从中间层特征开始规范预测值,进而逐步提高修复精度。同时使用联合上采样模块来实现浅层特征和深层特征之间的特征融合,保证修复结果整体与细节上的优化。
  本文实验的模型是基于Pytorch环境下搭建和运行的,其中图像修复使用开源CelebA人脸图像数据集,里面包含20多万张人脸图像。另外为了加强人脸标志点检测网络的预测能力,使用了包含多种类别的普通人脸标志点检测数据集300W和WFLW,进一步泛化人脸标志点的检测。实验结果表明,基于特征融合的标志点检测网络能解决残缺人脸标志点检测问题,同时,引入结构先验信息的图像重建,能够更好的修复人脸图像的纹理及结构细节,提高了人脸图像的修复效果。
其他文献
在过去几年里,尽管立场检测研究取得了很大的进展,但是现有的立场检测工作大多只关注训练集和测试集分布一致的情况,却忽略了社交平台话题的特点,即较快的更新速度。处理新兴的陌生话题领域也因此变得极为重要。为此,本文使用了深度神经网络作为基础模型来探索立场检测任务处理未知话题的方法。具体地,本文将从以下三个方面展开探索:(1)基于领域泛化的未知目标立场检测方法:本文将未知目标立场检测任务看作分类任务,首先
学位
近年来计算机断层扫描技术(CT)被广泛用于临床诊断,由于CT会产生较高的辐射,危害人体健康,医学界通常采用低剂量CT扫描技术(LDCT)来获取CT图像。尽管LDCT能够有效降低辐射量,但是LDCT图像容易引入更多噪声和伪影,最终可能影响放射科医生的诊断。由于CT原始数据难以获取,大量研究聚焦于直接对CT图像进行后处理去噪。现有CT图像去噪算法主要针对特定剂量的CT图像,且存在去噪后图像细节丢失、图
学位
随着网络优化,普适计算和物联网的快速发展,室内定位技术在消防救灾、地下停车寻车、商场购物等领域的应用越来越多。近年来,机器学习技术在诸多领域得到了广泛的应用并取得了很好的效果,故而越来越多的研究者开始采用机器学习的方法进行室内定位的研究,这推动了机器学习的室内定位方面的发展。本文研究了基于机器学习的室内定位技术,针对现有研究存在的问题,提出了三个有效的室内跟踪定位算法。  首先,为了提高定位的准确
学位
药物往往通过靶向相应的蛋白来发挥作用。因此,揭示药物和靶标的关系在药物开发中起着至关重要的作用。近年来,药物-靶标蛋白质相互作用(DTIs)的计算预测对于药物发现或药物重定位变得尤为关键。与昂贵且费时的体内或生物学试验相比,计算方法可以有效地识别潜在的DTIs并大大减少候选药物蛋白的范围。所以如何明确可靠的与药物相关的候选蛋白质,是一项值得研究的课题。本文提出了三种基于深度学习的DTIs预测方法-
现如今,人们正处于信息化的时代,研究学者们越来越热衷于从图像中获取所需的信息,而图像上的文本可以帮助人们更好的理解图像信息。因此,提取图像中的文本信息成为了近年来科研界的一个热门的研究任务,而自然场景下拍摄的图像非常复杂多变,给检测任务带来了极大的挑战。传统的机器学习方法已经不能满足任务的需求,得益于深度学习技术的推广和应用,给场景文本检测任务带来了新的机遇和可能性,广大研究学者纷纷将深度学习技术
学位
近年来,随着移动互联网和智能传感器技术的发展,移动群智感知计算模式在学术界、工业界和企业界得到广泛的关注。移动群智感知系统利用工人携带的智能设备的感知与计算能力,通过移动互联网进行协作来完成复杂的感知任务。在移动群智感知系统中,工人招募是一个核心共性的研究问题,是一种考虑任务和工人等因素的满足多种优化目标和约束条件的组合优化问题。移动群智感知中的工人招募问题的研究主要面临参与感知任务的工人数量不足
随着深度强化学习技术在视频游戏领域的不断发展,越来越多难度各异的视频游戏被深度强化学习智能体所掌握,这些智能体在某些视频游戏中甚至可以比肩人类职业游戏玩家。相较于视频游戏,基于文本语言的文本类游戏因其特殊的游戏方式和市场流行度较低等因素,使得关于文本游戏领域的研究相对于视频游戏领域要少一些。基于上述背景,本文将研究目光投向了流行度较低的文本游戏。在之前关于文本游戏的相关研究中,大多通过修改深度强化
随着人工智能的发展,我们的生活发生了翻天覆地的变化。其中,让机器懂得人类的语言一直是我们梦寐以求追寻的目标。人们对语言信息处理的需求越来越大,人们迫切需要用自动化的手段处理海量的语言信息。例如:机器翻译,问答系统,人机对话等。这些自然语言处理的应用已经深入的渗透到人类的日常生活中。但是,这些应用与人类的水平还有一段距离。其背后原因可能是机器并不是真正的理解自然语言所表达的含义。所以,自然语言理解的
在用户历史交互记录中,蕴含着丰富的映射用户潜在兴趣偏好的信息,这些信息可以帮助推荐系统建模,从而向用户推荐他们潜在兴趣的内容或商品,在电子商务领域中扮演着重要的角色。这种方式不仅方便用户以更高效、快捷的方式获取有利信息或商品,而且电子商务平台也可以通过推荐系统的技术,主动地将产品或者服务准确地投放给目标用户,以便他们获取更高的利润。由于用户的个性化商品推荐与人们日常生活息息相关,所以越来越多的研究
图像超分辨率重建是深度学习的重要分支,受到越来越多科研人员的关注。目前,图像超分辨率重建方法以深度学习为基础在图像的定性和定量上取得了突破性的发展。为了提高图像的重建质量,现有的基于深度学习的图像超分辨方法一般都是通过增加网络模型的深度提高图像的重建质量。但是,实验也表明随着网络模型深度的增加,图像过渡平滑现象会越来越严重。除此之外,由于自然场景下真实低分辨率图像受到天气、噪声和模糊度等因素的影响