论文部分内容阅读
三维技术在远程医疗、军事训练、教育教学、游戏娱乐、三维电视等领域有着广阔的应用前景和商业价值。对深度信息的精确获取是三维研究和三维实际应用中所必需的关键技术。近年来,随着三维技术的不断发展,许多的应用诸如:人机交互、三维电视、场景重建、手势识别、增强现实等都对获取场景的深度信息提出了更高的要求。这些应用需要更加稠密精确的深度信息,也需要更加快速的获取深度信息。本论文作者所在的实验室提出了较完整的具有创新性自然三维电视系统概念,其目的在于还原实际拍摄场景的真实深度,并向观众提供舒适可信的三维观赏体验。自然三维电视关键技术就在于真实获取场景的深度信息,根据深度信息重构出多个视点,以实现自由视点观看实际场景。因此视点重构技术对深度信息的精度就提出了更高的要求。目前主流的深度信息获取方式有两种:被动深度获取和主动深度获取。被动深度获取方法出现较早,其核心即立体匹配算法,主要思路是根据多相机拍摄所得到的同一场景一组图像,寻找场景中的同一点在这组图像中的匹配点。但是被动立体算法无法获取遮挡区域的信息,并且局部窗口算法或者全局优化算法均各自存在不可克服的缺点。本实验室进行的前期研究就是基于被动深度获取的思路获取场景深度,并以此为基础来实现三维自由视点显示,但这种方法所得到的深度图质量难以满足要求,最终的三维显示效果还有待提高。因此本论文决定使用主动深度获取方法来提高所得到深度信息的精度。主动立体采用特定的深度摄像机直接测量场景的真实深度。其中应用范围较广的是ToF摄像机(全称为time-of-flight camera),它能实时采集场景深度信息,其工作原理是通过发射源发射可控频率调制光线来进行测距。本文基于ToF深度摄像机对深度摄像机所测量深度的误差进行矫正,深度超分辨率恢复,以及结合立体匹配的深度融合做了一系列的实验和研究,主要的创新点和贡献如下:1.本文简要阐述了ToF深度摄像机的光学成像机制;本文针对影响ToF深度摄像机获取数据精确的最主要两类噪声(环境光噪声和多径误差噪声)进行了深入分析,提出了有效的针对性噪声消除方法。具体而言,根据从不同类型的室内场景实际拍摄数据分析这两类噪声产生的机理,建立了这两类噪声产生误差的数学模型;然后根据数学误差模型提出了相应的ToF原始深度图的滤波算法,实验表明可有效地消除ToF深度摄像机所捕获深度图的原始误差。2.由于受到ToF深度相机成像原理的限制,所获取深度图分辨率往往不高,因此存在深度图低分辨率与彩色场景图高分辨率难以匹配这一不足。为了提升ToF深度图的分辨率,本文根据ToF深度图特有性质,结合压缩感知相关理论,提出了一种联合字典学习算法,用于ToF深度图超分辨率恢复。该算法从训练数据中学习得到超完备字典,基于超完备字典去重建原始低分辨率深度图而得到高分辨率深度图。为了提升算法性能,本文在联合字典学习和重建过程中也提出了相应的分类和索引机制。3.为了进一步获取高质量稠密深度图,本文从ToF深度摄像机获取的深度图出发,结合立体匹配算法的优点,提出了一种基于ToF深度图的主被动深度获取融合算法。该算法设计了ToF深度能量函数来指导立体匹配,并结合所提出的主被动深度图置信度代价优化函数来实现深度融合。该算法可有效降低ToF深度图中一部分区域存在错误深度信息而造成的不利影响,也能够解决传统立体匹配方法易在重复纹理区域和低纹理区域出现错误匹配这一不足,相比较单独采用主动深度获取方法或被动深度获取方法去获取深度信息而言,这一融合算法取得了更精确的深度信息。