论文部分内容阅读
统计表明,大约75%的人脸图像为非正面的人脸图像,对于人脸识别及其相关问题来说,姿态估计是一个重要的前处理过程。在过去的十几年里,虽然人脸识别问题的研究取得了巨大的进步,但在姿态变化时进行鲁棒的人脸识别仍然十分困难。由于准确估计输入图像的姿态是解决这些问题的先决条件,因而姿态估计受到了越来越多的关注,其具有的理论意义和应用价值不言而喻,但人脸复杂的三维结构以及多变的图像采集条件是姿态精确估计的瓶颈问题。针对姿态估计的输入图像往往存在误配准的情况,本文基于稀疏表示和模板匹配的方法,对已经检测到的人脸区域进行快速的背景检测,裁剪并填充多余的背景,从而有效地提高人脸区域相对面积,实现多姿态图像的有效粗配准,为后续的特征提取和姿态分类提供理想的输入数据。此外,在基于表观的姿态估计方法中,另一个关键的问题为分类器设计问题,即对于提取得到的特征,需要通过分类算法估计姿态的大概范围或者用回归算法来估计得到连续的姿态角度。鉴于姿态估计也是一个人脸视觉的感知问题,本文从稀疏表示与人类视觉系统的相关性出发,探讨把稀疏表示扩展到姿态估计问题中,并研究动态字典学习的方法产生完备字典集,同时利用姿态类别的连续性信息,提高稀疏表示的判别能力和回归能力。