基于深度信息的实时头部姿态估计

来源 :厦门大学 | 被引量 : 0次 | 上传用户:xiaowen51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
头部姿态估计作为计算机视觉的重要问题,在人脸识别与身份认证系统、智能安全监控系统、视觉注意力监测系统、辅助安全驾驶系统、视频会议系统、人机交互等众多领域中具有广泛的应用,也是近年来越来越热门的研究方向。其主要研究的问题是计算机通过对输入图像或者视频序列的分析、预测,确定人的头部在三维空间(相对于摄像机)中的位置及姿态参量。然而在真实场景中,比如摄像机的失真、投影变化、光照环境变化,以及人的外观、面部表情、部分遮挡、配件(如眼镜、帽子)等都会给头部姿态估计问题带来极大的困难。目前,大多数可用的算法并不能实时估计头部姿态,往往在初始化时需要一些预设的正面姿势,或是在实时估计下不能处理全范围的头部运动。  本文针对上述问题,研究了近年来国内外对于头部姿态估计问题的诸多方法和技术,提出了基于深度信息的实时头部姿态估计方法,结合当前在机器学习方法中流行的随机森林算法,分别使用高质量的ETH人脸姿态深度图像数据集和基于Kinect获取的低质量深度图像数据集来训练和测试本文提出的算法性能。  本文完成的主要工作和贡献有:  (1)采用了基于深度信息的随机森林回归方法。在已标记的高质量ETH人脸姿态深度图像数据集训练和测试,不依赖于检测特定的面部特征,进行头部姿态估计。  (2)提出基于判别模型的随机森林回归方法。由于基于Kinect获取的低质量深度图像数据集包含了人体其他部分的深度信息,首先将头部姿态估计问题转化成一个分类问题来处理,标记正负样本集,采用样本加分类标签的形式进行训练,然后结合随机森林回归方法估计头部姿态。该方法共同解决了分类和回归问题。  (3)设计了一个基于Kinect深度信息的实时头部姿态估计系统。该系统不依赖于特定的硬件环境,且不需要手动初始化设置,可以根据速度和精度的要求来调节平衡点。  实验结果表明,本文方法不依赖于检测特定的面部特征(如鼻子等),并且在大范围内的旋转、面部表情、头部部分遮挡、配件(如戴眼镜)的情况下都能鲁棒地完成头部姿态估计。在本文最后,分析了提出方法的主要问题并展望了未来的研究方向。
其他文献
相对于高速发展的信息化,会议系统行业是信息化发展相对较为迟缓的领域。而现代的会议对会议系统的要求却越来越高,不仅在功能上要求实现智能化、数字化,还要求根据自身情况对产
突发事故一旦发生,如何快速检测网络舆情非常重要。由于我国微博用户数量的快速增长和微博在信息传播速度、广度和便捷性上的优势,微博在聚合网络舆论方面发挥了巨大的作用,发展
随着智能触屏手机、平板电脑以及嵌入式PDA等设备的快速普及,嵌入式移动设备在工业控制、娱乐消费及医疗卫生等诸多领域得到了广泛应用。目前绝大多数医疗信息系统(HospitalIn
极端学习机(ELM: Extreme Learning Machine)是训练单隐含层前馈型神经网络的学习算法,它不用迭代调整权值,隐含层的输入权值和偏置都是随机生成的,输出权值是通过分析的方法确定
智能监控技术是计算机视觉和安全防范监控领域的一个研究热点,主要涉及计算机视觉、模式识别、人工智能、视频分析与处理等多个领域,以该技术为支持的智能视频监控系统因其广阔
铁路轨道是铁路运输的基础设施之一,在车辆行驶中,来自机车车体的压力和震动直接作用于轨道,导致轨道质量发生恶化。轨道质量状态的优劣影响到列车运行安全性、旅客乘车舒适
随着信息技术的发展,需要存储和管理的数据越来越多,作为存储系统重要支撑之一的分布式文件系统将面临更严峻的挑战。缓存机制是提高分布式文件系统性能的重要手段。本文以分布
无线传感器网络具有通信能力有限、电源能量有限、计算速度和存储空间有限、传感器节点配置密集和网络拓扑结构灵活多变等缺陷,不能保证数据信息在传输中机密性,完整性,真实
近年来,虚拟化技术凭借其良好的独立性、高资源利用率和容易管理的特性备受业界关注,已经在数据中心的系统安全、负载均衡、服务器管理整合等方面得到广泛的应用。虚拟化环境
目前,汽车日趋复杂与异构,通常涉及机械、电子、通信、液压、控制等多个学科领域。完整地设计跨领域复杂系统需要对系统进行多领域建模,传统汽车开发方法难以控制系统的复杂