论文部分内容阅读
基于深度图像可以方便的区分前景和背景,有效提高自然人机交互的性能。要实现面向大众的自然人机交互,需要深度摄像头在实时性、价格、适应环境等方面达到实用性。基于面结构光技术的深度摄像头实用性强,得到了迅速发展。但是目前深度摄像头价格不菲,深度图计算技术还被外国少数公司所垄断。研究深度图计算方法,不仅可以在学术上做出一定借鉴意义的工作,更有助于打破国外技术壁垒,提高我国深度摄像头制造行业,体感游戏行业等相关行业竞争力。本研究使用散斑图结构光图像,基于图像块匹配算法,实现了深度信息的获取,并且通过插值算法和滤波算法提高了深度图的质量。算法实时性好,精度高,实现了以30帧/秒的速度实时计算深度值,近景深度分辨率达到1cm。采用本方法,智能电视和家用电脑只要增加一个“红外发射元件”,就可以具有自然人机交互功能。在此基础上,本文还提出了向量场模式识别的深度图算法DepthVH和基于SVM的深度决策树算法DepthST,用以降低图像匹配算法的计算量,进一步降低深度摄像头成本。DepthVH通过生成具有深度相关特征的向量场,将深度信息变换为特征信息,通过直接识别各个深度点周围的向量场特征,将该特征信息逆变换为深度信息,实现类似哈希映射的搜索,避免了线性搜索匹配算法的巨大运算量。DepthST使用SVM实现深度决策树,可对每一个像素点的深度做迅速分类。DepthVH和DepthST算法精度较匹配算法有所下降,但是大大降低了深度计算的计算量,可应用于对精度要求较低但对深度摄像头成本敏感的场景。