论文部分内容阅读
视觉感知是人类的主要信息源,人类感知外界信息的80%来自视觉。使计算机能像人那样通过视觉来观察和理解世界,并具有自主适应环境的能力,是人类多年以来的梦想。但是,当前视觉传感器通常只能给出景物的二维图像,而这种3维向2维的映射导致了深度信息的丢失。计算机视觉中深度信息的缺失,使得许多应用,例如机器人导航、模式识别及分类技术等,受到限制。因此,深度重构是计算机视觉中最重要的任务之一。 由双目(立体)、运动、明暗、纹理、聚焦、散焦重构景物深度的研究虽然已经有几十年的历史,但是,由摄像机获取的强度信息重构深度,仍然是一个挑战问题。因为,摄像机获取的强度信息是景物中多种因素的函数,例如纹理梯度、相对位置、遮挡、轮廓连续性、表面阴影变化、表面光度变化、透视视差等,深度重构是一个非常不适定问题。 偏微分方程(partial differential equation,PDE)是数学的最重要部分之一,PDE解的计算是当前科学计算(scientific computing)中主要关注的问题,特别是它与变分问题的自然联系,使得许多不适定问题得到较适当的正则化。近年来,它也迅速注入到计算机视觉领域,使得传统图像处理采用的数学工具突破了十九世纪数学子集的范畴,成为图像处理中活跃的现代研究工具之一。 论文采用偏微分方程和变分(variational)作为数学工具来研究计算机视觉中的一个重要问题——深度重构。基于光的波动和几何学的概念,论文采用了散焦技术和相位成像技术,或更具体地说从点扩散函数和光的强度传递方程两种途径来研究从散焦图像获得景物深度的重构问题。从应用的角度来说,此研究的一个极大优势是采用非干涉光的方法,极其适合于自然景物中的应用。 论文的主要内容包括:建立基于总变分和各向异性热扩散的散焦成像模型,形式化深度、点扩散函数的扩散参数及摄像机参数之间的关系,并且通过求解泛函极值问题来重构景物深度;进一步,利用光强度传递方程来研究图像强度信息与相位之间的关系,探讨从散焦图像恢复相位的理论基础和实现方法。 论文的主要工作及创新成果如下: 首先,在几何光学的框架下,对基于点扩散函数的景物深度重构方法进行了研究。本文讨论了散焦图像与点扩散函数中的扩散参数之间的关系,推导了描述扩散参数与景物深度和摄像机参数之间关系的数学公式,指出在已知摄像机参数的条件下,点扩散函数的扩散参数是景物深度恢复的关键参数。为了使此不适定问题正则化,论文提出了一种新算法,将散焦图像深度重构转化为带有扩散参数约束的能量泛函极值问题,进一步在能量泛函中使用总变分测度;此新算法被称为基于总变分的由散焦图像重构景物深度的方法:在用各向异性热扩散建模散焦成像基础上,采用变分原理将能量最小化问题转换为偏微分方程的求解问题,最后通过方程迭代获得深度的最优解。实验结果表明,该算法的均方根相对误差比最小二乘法的,减少了大约50%。 针对景物深度重构过程中出现的边缘深度信息泄漏现象,提出了一种基于方向性热流扩散(OHFD)的景物深度重构算法:把散焦图像成像过程建模为沿着两个正交方向,并加权的1D方向性热流扩散,设计了扩散方向和对应的扩散系数。通过对扩散系数的选择,实现了在深度平滑区域图像各向同性扩散,在深度跳变边缘图像各向异性扩散。实验结果表明,该算法较好地避免了深度跳变边缘深度信息的泄漏。无论在同一深度层次上,还是在深度跳变处,OHFD算法较最小二乘法都更能精确地重构深度。 研究了基于强度传递方程的相位恢复问题。在分析波动光学理论的基础上,介绍了基于强度传递方程的相位恢复理论和两种强度传递方程的求解方法,指出算法存在的局限性。引入变分原理,并结合强度传递方程对相位恢复进行了研究。