论文部分内容阅读
面部属性分析是计算机视觉领域研究的热门问题,智能且精准的面部属性分析有着广而深的现实意义。现有的面部属性分析算法,主要分为基于浅层模型的方法和基于深度学习的方法。基于浅层模型的方法的优点在于模型较小,而其缺点在于估计的精确性和鲁棒性较差,对于特征提取的能力有限。近年来随着以大规模数据集训练为基础的深度学习方法的高速发展,在人脸面部属性分析的研究中,深度神经网络因为其面部特征提取的强大能力以及出色的性能已经成为当前的主流方法。然而算法在实际应用中,众多干扰因素的影响(人脸图片带有姿势、照明、遮挡及错位等变化)对整个模型的影响是巨大的,因此设计高效的面部属性分析仍具有重要的科研和实际意义。针对这些问题,本文将围绕人脸面部属性中的性别识别、年龄估计、头部姿态估计和表情识别这四种重要属性展开,提出了三种基于深度学习的面部属性分析算法,包括:(1)提出基于自步学习和深度学习结合的性别识别算法,该算法基于卷积神经网络,在此基础上加入自步学习策略,采取一种逐渐学习的训练策略,此模型更加强调可靠样本,从简单样本到复杂样本进行训练,随着该模型的逐步学习以及复杂样本的加入,从而避免了深度学习的模型陷入较差的局部最小值。该算法在IMDB和UTK数据库上的准确性比不加自步学习的深度模型分别提高了 1.55%和1.43%。(2)提出基于样本不确定性的自步深度回归森林算法,用于年龄估计和头部姿态估计。首先借助于自步学习,该算法将混淆和噪声图像与常规图像区分开来,并减轻它们所带来的干扰,同时通过结合样本的不确定性,减小由样本标签的不平衡性引起的深度回归森林中的有偏解问题。该算法在Morph Ⅱ和FG-NET年龄估计数据库上的平均绝对误差分别比深度回归森林算法降低了 0.26和0.29岁,在BIWI头部姿态估计数据库上的平均绝对误差比深度回归森林算法降低了 0.26度。(3)提出基于视觉显著性的深度学习算法,用于面部表情识别。该算法通过视觉显著性预测准确高效地解释了面部的情绪表达,探索了视觉显著性图像区域信息对深度模型的作用影响。在数据库FER2013和CK+上的面部表情分类准确率以及混淆矩阵验证了,视觉显著性区域的信息几乎可以达到原始图像完整信息的较高精度的预测水平,说明了视觉显著性区域的有效性。