论文部分内容阅读
在计算机视觉和图像感知研究领域内,目标的检测和定位是一个研究的热点问题,而且许多相关问题的研究都依赖于目标检测的结果和定位的精度,因而得到越来越多研究者的重视。在人脸相关的领域内,面部特征点定位作为人脸图像分析问题的一个关键步骤,为后续的人脸识别、姿态估计、表情分析、人脸动画等提供了技术保证。但是由于在很多情况下人脸图像存在着姿态变化,表情变化,光照变化等一系列复杂变化,受此影响人脸图像特征点定位的精度还不能满足实际应用的要求,所以研究出速度快,精度高,适用性好的面部特征点定位方法就成为了人脸相关的研究中的当务之急。本文正是针对这一重要研究课题,进行了深入的理论研究和应用实践。对面部特征点定位和形状提取问题的研究,主要的研究内容集中在两个方面:一个是建立独立特征点的局部纹理模型,另一个是建立所有特征点的全局形状模型。本文从这两个方面着手提出了新方法,取得了新成果。本文的主要研究成果包括:(1)提出基于双向级联结构的特征点检测和定位方法。所有面部特征点总体的定位准确度是和每一个独立的特征点的定位精度分不开的,尤其是眼睛,鼻子,嘴等一些关键特征点的定位,这些特征点为更多其他的面部特征点提供初始的搜索范围,使得定位算法更稳定。本文通过这种双向级联结构的分类器设计来对特征点的局部纹理建模,这样可以更加精确,同时也更加快速地检测和定位这些关键特征点的位置。所谓双向是指在训练过程中,对正例样本和反例样本交替进行重采样的过程。与传统方法相比本文方法具有以下几个优点:可以应对大规模的数据集;可以处理存在复杂变化的正反例样本;而且无论是在训练过程,还是在测试过程,该算法都能快速地过滤大量的“易分”样本,获得了较高的执行效率。(2)提出一种增强的主动形状模型方法。该方法是在单个特征点独立检测的基础上,引入了全局的形状模型,并且将每个特征点检测器的输出值作为检测到这个特征点的信度。将那些检测信度比较低的特征点作为缺失点进行处理,这些点的最终位置不通过特征点检测器给出,而是通过信度比较高的特征点来预测得到。这种预测是以最大化形状概率为目标,解析地得到不可信特征点的位置,因而当检测器输出的信度较低或者是检测不到特征点时,算法的定位精度不会受到太大的影响,可以应对存在缺失特征点的情况。通过以上的设计,本文将传统的主动形状模型进行了有效地增强。(3)提出基于贝叶斯推理的人脸形状提取方法。在该方法中,本文将单个特征点的分布和全局形状的分布用概率描述的形式来表达,统一到贝叶斯推理的概率框架之中。特征点定位的目标转化为最大化形状的后验概率,然后通过迭代求解的方式使得所有特征点最终收敛于正确的面部特征点位置。在推理的过程中,本文对控制形状的两种参数(包括几何参数和形状参数)分别进行优化:根据特征点位置移动和这两种参数变化之间的关系分别采用了梯度上升和高斯–牛顿优化算法。并且根据算法的推导结果定义了一种称为“概率梯度提示”的变量,人脸形状正是在这种变量的驱动下不断的更新,从而完成面部特征点的定位和人脸形状的提取。(4)提出基于人脸坐标回归模型的特征点定位和形状提取方法。基于上述的特征点检测方法和形状建模方法,本文进一步提出基于人脸坐标系的人脸形状表示,将面部特征点定位问题转化为人脸坐标的对应问题。在这个人脸坐标系的定义下,本文提出了基于人脸坐标回归的特征点定位和形状提取方法,对图像上的局部表观使用回归算法得到对应的人脸坐标,并且结合形状模型设计了使得所有特征点的回归误差之和最小的目标函数,最后通过迭代优化的方式求解最佳的形状。本文提出的以上几个算法和设计在多个人脸数据库上进行了实验和验证,实验结果表明本文提出的面部特征点定位方法是有效的和可行的。