论文部分内容阅读
立体视觉主要研究如何利用多图像成像技术从多幅图像里获取场景中物体的距离(深度)信息,基本方法是从两个或多个视点去观察同一场景,获得不同视角下的一组图像,然后通过三角测量原理获得不同图像中对应像素的位置差别,即视差,进而推断场景中目标的空间位置。立体匹配是计算机视觉和非接触测量研究中最基本的关键问题之一,该技术使得通过像点的视差来获取深度或距离信息,可以为三维重建、机器人导航、自主车导航等提供有用的信息,在实际应用中,因为变形,扭曲,遮掩等情况的影响,立体匹配是较难彻底解决的一个病态问题。在实际应用中,双目视觉更接近于人的双眼视觉原理,并且在实际应用中更容易实现,本文对双目视觉的立体匹配相关理论及一些方法进行了研究,并给出了阶段性的算法描述和实验结论。基于相关窗口的方法利用邻域相似性进行匹配,该方法主要存在的问题是相关窗口大小的选取,选择的窗口太小,那么在平滑区域出现匹配率下降,选取的窗口太大,那么在视差边缘处会变得模糊。针对这一问题,文中将将整个图像分为特征区域和非特征区域分别进行匹配,文中给出了匹配的策略和解决方法。针对相关窗口方法中计算量大的问题,分析并减小了匹配过程中的冗余计算,大大提高了算法的执行速度。针对大视差图像匹配中的搜索范围较大的问题,提出了基于整体估计视差估计和基于梯度限制的搜索范围减小的匹配方法,以达到减小算法运行时间的目的。图像变换是图像处理中不可缺少的必要手段,文中在对Walsh变换和Rank变换进行分析的基础上,利用变换后的特征进行匹配工作。Walsh变换特征比原图像的灰度信息包含了更多的特征,如零交叉点,系数正负性等;Rank变换统计当前信号与周围信号的大小关系,其变换结果就是比当前信号幅值小的信号的数量值,并结合Census变换距离作为约束条件进行匹配。与采用简单的灰度特征作为匹配基元来说,以这两种变换特征作为匹配基元进行匹配得到了较好的效果。矩理论在图像分析和处理方面有着广泛的应用,从数字图像计算出来的矩集,通常描述了该图像的全局特征,并提供了大量的关于该图像不同类型的几何特性信息。图像矩的这种特性描述能力被广泛用于各种图像处理、计算机视觉和机器人技术领域的目标识别与方位估计中。文中对Tchebichef正交矩能对图像进行精确重建的原理,利用点矩特征作为匹配基元对图像进行匹配,得到了较好的效果,并讨论了利用图像重建误差图像进行匹配的可能性和有效性;最后通过矩对区域的平移、旋转和尺度变化的不敏感特性,讨论了基于不变矩的区域匹配方法,通过引入相对位置约束提出了一种新的匹配策略。基于视觉的方法是障碍物检测中的一个重要研究领域,其中对图像进行有效快速的分割是关键之一,针对多阈值分割方法的阈值确定的复杂性和基于区域增长等方法的耗时性,提出了基于特征区域的简单快速分割方法,其关键是通过平滑性指标函数提取特征区域,经过提取后的图像简化为二值图像,这样使分割工作更为简单快速,对分割后的区域利用其重心和面积特征进行匹配,根据匹配区域的轮廓和视差来判断障碍物的位置和距离。该方法不需要对目标作先期了解和建模,在实际应用中具有通用性和实用性。