论文部分内容阅读
现有的图像修复方法,主要针对自然场景、建筑物等图像,对于人脸图像的修复并没有过多的深入研究。自然条件下的人脸图像的修复,会随着人脸姿势、遮挡、表情等因素而造成修复结果产生偏差,比如出现边界区域模糊、结构不连贯等问题。本课题着重关于人脸图像的修复展开研究,提出了基于人脸结构特征先验引导的图像修复算法,该算法通过在残缺人脸图像中使用卷积神经网络提取人脸结构潜在信息,然后通过人脸结构条件约束和重建隐藏层内容约束来进一步提升重建后的图像结果,本文主要工作如下:
首先,针对残缺人脸图像标志点检测问题,分别基于VGG16和MobileNet-V2为骨干网络进行残缺人脸标志点检测网络的构建,并提出了基于特征融合的标志点检测网络。残缺人脸图像经过卷积层进行特征提取,在进行标志点预测之前,将不同层的特征进行融合,实现不同尺度上有效信息的整合,从而提高标志点的检测精度。
其次,为了提高人脸图像修复结果的结构细节,将人脸标志点结构先验信息嵌入人脸修复网络。与自然场景相比较,人脸图像具有较强的拓扑结构一致性。对于残缺待修复图像预先预测出其对应的人脸标志点特征图,并将其作为先验信息来引导图像修复网络的训练,同时为了优化重建网络,加入扩张残差,在提取更深层次特征信息的同时保证特征的分辨率,为后续的重建工作做准备。
最后,为了优化图像重建子网络,提升图像修复的质量,提出了基于深度监督的分支网络。通过对重建子网络的中间隐藏层特征添加软约束,从中间层特征开始规范预测值,进而逐步提高修复精度。同时使用联合上采样模块来实现浅层特征和深层特征之间的特征融合,保证修复结果整体与细节上的优化。
本文实验的模型是基于Pytorch环境下搭建和运行的,其中图像修复使用开源CelebA人脸图像数据集,里面包含20多万张人脸图像。另外为了加强人脸标志点检测网络的预测能力,使用了包含多种类别的普通人脸标志点检测数据集300W和WFLW,进一步泛化人脸标志点的检测。实验结果表明,基于特征融合的标志点检测网络能解决残缺人脸标志点检测问题,同时,引入结构先验信息的图像重建,能够更好的修复人脸图像的纹理及结构细节,提高了人脸图像的修复效果。
首先,针对残缺人脸图像标志点检测问题,分别基于VGG16和MobileNet-V2为骨干网络进行残缺人脸标志点检测网络的构建,并提出了基于特征融合的标志点检测网络。残缺人脸图像经过卷积层进行特征提取,在进行标志点预测之前,将不同层的特征进行融合,实现不同尺度上有效信息的整合,从而提高标志点的检测精度。
其次,为了提高人脸图像修复结果的结构细节,将人脸标志点结构先验信息嵌入人脸修复网络。与自然场景相比较,人脸图像具有较强的拓扑结构一致性。对于残缺待修复图像预先预测出其对应的人脸标志点特征图,并将其作为先验信息来引导图像修复网络的训练,同时为了优化重建网络,加入扩张残差,在提取更深层次特征信息的同时保证特征的分辨率,为后续的重建工作做准备。
最后,为了优化图像重建子网络,提升图像修复的质量,提出了基于深度监督的分支网络。通过对重建子网络的中间隐藏层特征添加软约束,从中间层特征开始规范预测值,进而逐步提高修复精度。同时使用联合上采样模块来实现浅层特征和深层特征之间的特征融合,保证修复结果整体与细节上的优化。
本文实验的模型是基于Pytorch环境下搭建和运行的,其中图像修复使用开源CelebA人脸图像数据集,里面包含20多万张人脸图像。另外为了加强人脸标志点检测网络的预测能力,使用了包含多种类别的普通人脸标志点检测数据集300W和WFLW,进一步泛化人脸标志点的检测。实验结果表明,基于特征融合的标志点检测网络能解决残缺人脸标志点检测问题,同时,引入结构先验信息的图像重建,能够更好的修复人脸图像的纹理及结构细节,提高了人脸图像的修复效果。