论文部分内容阅读
基于人脸图像的头部姿态估计与年龄估计是指计算机从人脸面部图像中自动识别其头部姿态及估计其年龄。头部姿态估计及年龄估计因其在身份鉴定、安全监控、人机交互等众多现实课题中的重要性成为如今计算机视觉研究领域的重要课题之一。虽然目前研究人员己对使用人脸图像自动地估计头部姿态和年龄进行了大量的研究,但是由于人脸图像的表情变化、光照变化、尺度变化、个体变化等外观因素的影响,根据人脸图像进行头部姿态估计和年龄估计仍然是十分困难和富有挑战性的研究课题。概括的说,头部姿态估计和年龄估计的研究都可以分为两个主要步骤,一是具有判别力的人脸图像特征提取,二是识别模型的建立。因此本文在国内外已有的研究基础上从提取具有更强描述能力的人脸图像特征并通过机器学习方法进行识别的角度对头部姿态估计和年龄估计进行了深入的研究,主要创新如下:1)提出一个新的人脸图像特征表示方法,叫做李代数高斯特征。构建人脸图像李代数高斯特征的第一步是对人脸图像进行稠密的图像块划分并从图像块中分别抽取基于形状、纹理、颜色的核描述子特征,它们是反应人脸图像中的头部姿态变化和年龄变化特性的重要外观信息。然后使用基于通用背景模型的高斯混合模型建模图像块的特征分布得到人脸图像的全局外观。高斯概率密度函数己被证明具有李群流形空间结构性质,为保存人脸外观的空间结构信息通过将每个图像特定的高斯混合模型的各个高斯成分投影到李代数空间上就可以得到该人脸图像的李代数高斯特征。因此李代数高斯特征既可以捕捉人脸图像的外观特征也可以保存人脸外观中的流形空间结构,而且该流形结构是从图像的特征空间上抽取的,它更有可能对应着头部姿态图像的姿态流形结构或者年龄图像的年龄流形结构,因此李代数高斯特征可以在头部姿态估计和年龄估计取得良好性能。2)提出对人脸图像进行空间金字塔划分从所有的子图像中提取李代数高斯特征得到人脸图像的多尺度李代数高斯特征表示方法,多尺度李代数高斯特征能够从人脸图像中抽取更多的局部信息所以将有助于头部姿态估计。但是多尺度李代数高斯特征也存在维数较高的问题,为解决此问题使用主成份分析方法对多尺度李代数高斯特征进行降维然后基于最近质心分类器进行头部姿态估计。本文进一步基于多尺度李代数高斯特征使用了基于噪声属性投影的最近质心分类器方法来判别不同人脸图像的头部姿态类别,该方法能够充分利用人脸图像的头部姿态标签信息,寻找更多姿态相关特征的比较。3)基于人脸图像的多尺度李代数高斯特征研究使用支持向量机分类器进行头部姿态估计。考虑到人脸图像中包含很多与姿态无关的图像特征,而我们的多尺度李代数高斯特征并未剔除这样的噪声,为克服该缺陷我们采用基于类内协方差归一化的支持向量机分类器算法进行头部姿态估计,该分类器相比一般的多类支持向量机分类器在特征分类过程中能够更好的剔除与姿态无关的特征比较从而使得最终的头部姿态分类更加准确。4)在年龄估计问题上本文通过分析人脸图像年龄的分段和时序特性进一步提出一个新的从粗到细的两层年龄估计方法,该方法首先通过对全局支持向量回归值的局部自适应中评估出一副人脸图像的粗略年龄范围,然后从该缩小的年龄范围内学习一个局部支持向量机分类器来预测该人脸图像的精确年龄值。该方法克服了手动设定年龄分组的缺陷,能够自动的为每幅图像求得其所在的年龄范围,从而使得下一步的局部搜索过程中确定最可能的那个年龄标签值。