论文部分内容阅读
随着计算机运算能力的不断增强,计算机视觉研究得到了持续的发展,在监控、检索、识别、导航、医疗、教育等领域的应用为人的视觉提供有效的补充,甚至在某些方面很好地替代了人的视觉。虚实混合作为计算机视觉的重要应用之一,是通过特殊的设备,将计算机产生的虚拟信息与现实环境无缝融合,给人们提供额外的信息,如说明文字、视频教程、三维动画等。本文涉及的增强现实是虚实混合技术的一种,利用相关计算机视觉技术分析现实场景中的物体和环境特征,并在指定的位置绘制计算机生成的附属信息,帮助人们更好地理解场景。一般的增强现实系统,包括视频输入、特征分析、摄像机定位、虚实融合等模块,其中特征分析和摄像机定位是最核心的模块。离线增强现实已经在电影工业,视频广告中得到广泛应用,然而实时增强现实更多地处在实验阶段。本文主要研究实时增强现实的三维跟踪技术,即实时地恢复摄像机与场景之间的相对空间方位,内容包括多线程技术框架设计、图像特征分析、大规模场景的关键帧表达、和纯旋转相机下的双层分割方法。总体来说,本文希望能促进实时三维跟踪技术在增强现实中的应用,主要贡献在以下几个方面。·提出统一的实时增强现实系统框架。在关键技术充分模块化,模块接口标准化的基础上,将各种现实环境下的增强现实统一在一个多线程并行框架里,用户可以便捷地在此基础上开发新的增强现实应用,而且这个框架充分利用了多核机器的计算能力,使系统在适应各种复杂环境的情况下保证高效可靠的性能。·提出改进的基准标志系统。在一些桌面增强现实应用中,系统不能从自然场景中提取足够的特征定位摄像机,必须辅以基准标志。本文提出的基准标志是包围在黑色方框中的汉字图像。为了在复杂的光影下也能稳定地检测出标志,系统利用边缘信息检测标志的包围框。同时,本文将汉字的结构表达为汉字轮廓到边框的距离场,增加了汉字标志的可识别度。另一方面,传统的基准标志一般是黑白图案,从视觉上看很不美观,本文于是利用自然图像作为基准标志的补充。提出基于关键帧的场景表达和快速选择候选关键帧方法。在大规模自然场景中,系统利用Structure-from-Motion技术从预处理视频序列中恢复场景的稀疏三维点云。由于大规模场景的特征过于丰富,特征匹配在时间和数量上的性能都会明显下降。本文通过贪婪优化方法,从输入预处理视频序列中自动选择一些关键帧,这些关键帧将包含比较稳定的,特征明显的三维特征点。三维跟踪通过图像识别算法,为输入图像选择相似的候选关键帧,然后只跟候选关键帧进行特征匹配。为了获得更稳定的跟踪结果,本文还利用极线约束,连续帧跟踪等方法匹配更多特征点。提出摄像机纯旋转运动下,快速稳定地分离前景背景物体的方法。由于场景和摄像机运动的双重复杂性,场景层次分割是处理增强现实中的虚实遮挡的重要方法,同时也是非常难解决的问题。本文尝试解决在摄像机只有旋转运动情况下前背景之间的遮挡,这事实上是一个前背景分割问题。系统首先建立背景的全景图,然后将实时输入图像与背景全景图配准,估计背景信息,并利用图割算法进行分割。针对复杂背景和背景配准误差,本文结合过分割方法对背景全景图建立局部颜色模型,同时压制背景的颜色反差信息。系统得到精确的分割结果,并实现了一系列特殊的增强现实效果。