论文部分内容阅读
随着计算机视觉和图形学的快速发展,图像因其表示直观、传递便捷,逐渐成为人们日常信息交流的主要载体。其中,人物图像在很多领域都有着广泛的应用,例如身份验证、人机交互、监控、取证、医疗诊断和治疗等,这促使其成为机器识别和计算机视觉的主要课题之一。而且,由于人脸是人体上蕴含差异化信息最多的部分,因此人们仅通过观察人脸便能获得丰富的信息,如人的性别,种族、年龄、健康、情绪,甚至职业等等。本文的研究重点则在于人脸编辑。在手机等移动设备已经普及的当下,朋友圈和微博等应用促进了社交网络的分享功能。很多人喜欢将自己或者家人的照片分享到社交网络上,以获得更多的关注。然而,对于一般用户而言,其拍摄的照片往往会存在缺乏层次感、曝光不足、色彩饱和度低等问题。若是没有一定的摄像功底,人们很难拍摄出意境和光照俱佳的照片。这时,图像编辑便能帮助人们解决这一问题。即使对于部分面部有"缺陷"的人,例如受伤,雀斑,圆脸等通过化妆都难以遮盖的问题,人们也可以通过人脸编辑的手段来得到较为满意的照片。目前市场上有诸多图像编辑软件,例如Adobe公司的Photoshop、美图公司出品的美图秀秀等等。其中部分软件的确能较好的实现图像编辑功能,但这需要用户具备一定的专业技能,一般用户难以迅速上手。虽然市场上还有部分软件能进行"一键式"操作,对整张图像进行一键调整,但调整后的图像没有保留应有的细节,让人一眼就能看出编辑的痕迹。这些问题的存在使得用户的需求没有得到充分满足,需要对其进行进一步优化。为了解决上述问题,获得更加真实的人脸图像编辑效果,本文基于深度学习获得像素级人脸图像标注的高精度结果,并在其基础上获得了更加真实可信的人脸编辑图像。文章主要分为两个方面:第一,训练全卷积神经网络模型,即输入一张人脸图像,就能得到对应高精度的像素级人脸图像标注结果;第二,对人脸图像自动应用人脸编辑操作,如人脸光滑、人脸克隆、人脸融合和人脸化妆。借助高精度的像素级人脸图像标注结果,可以对人脸图像的每一块语义区域分开处理,从而保留视觉上较为关注的细节。本文的核心在于基于全卷积神经网络,针对人脸这一特殊的结构特征,加入形状先验粗略得出每一类标签的大致位置,从而为全卷积神经网络的学习提供引导。大量的实验结果表明,本文算法不仅能支持任意尺寸人脸图像的输入,以较快的速度获得高精度的像素级人脸图像标注结果,而且在人脸图像编辑上获得了有说服力的视觉效果。