论文部分内容阅读
头部姿态估计作为计算机视觉的重要问题,在人脸识别与身份认证系统、智能安全监控系统、视觉注意力监测系统、辅助安全驾驶系统、视频会议系统、人机交互等众多领域中具有广泛的应用,也是近年来越来越热门的研究方向。其主要研究的问题是计算机通过对输入图像或者视频序列的分析、预测,确定人的头部在三维空间(相对于摄像机)中的位置及姿态参量。然而在真实场景中,比如摄像机的失真、投影变化、光照环境变化,以及人的外观、面部表情、部分遮挡、配件(如眼镜、帽子)等都会给头部姿态估计问题带来极大的困难。目前,大多数可用的算法并不能实时估计头部姿态,往往在初始化时需要一些预设的正面姿势,或是在实时估计下不能处理全范围的头部运动。 本文针对上述问题,研究了近年来国内外对于头部姿态估计问题的诸多方法和技术,提出了基于深度信息的实时头部姿态估计方法,结合当前在机器学习方法中流行的随机森林算法,分别使用高质量的ETH人脸姿态深度图像数据集和基于Kinect获取的低质量深度图像数据集来训练和测试本文提出的算法性能。 本文完成的主要工作和贡献有: (1)采用了基于深度信息的随机森林回归方法。在已标记的高质量ETH人脸姿态深度图像数据集训练和测试,不依赖于检测特定的面部特征,进行头部姿态估计。 (2)提出基于判别模型的随机森林回归方法。由于基于Kinect获取的低质量深度图像数据集包含了人体其他部分的深度信息,首先将头部姿态估计问题转化成一个分类问题来处理,标记正负样本集,采用样本加分类标签的形式进行训练,然后结合随机森林回归方法估计头部姿态。该方法共同解决了分类和回归问题。 (3)设计了一个基于Kinect深度信息的实时头部姿态估计系统。该系统不依赖于特定的硬件环境,且不需要手动初始化设置,可以根据速度和精度的要求来调节平衡点。 实验结果表明,本文方法不依赖于检测特定的面部特征(如鼻子等),并且在大范围内的旋转、面部表情、头部部分遮挡、配件(如戴眼镜)的情况下都能鲁棒地完成头部姿态估计。在本文最后,分析了提出方法的主要问题并展望了未来的研究方向。