论文部分内容阅读
引言:随着光电子技术和数字序列图像处理及分析技术的深入发展,由运动恢复形状的研究越来越受到研究人员的重视。本文在特征点检测方面,分类总结了现有的二维图像特征(兴趣点)检测方法,分析了不同方法各自的优缺点,并着重分析和评价了几种典型的兴趣点检测方法的性能。
一、研究背景和意义
随着光电子技术和数字序列图像处理及分析技术的深入发展,由运动恢复形状(Structure/Shape From Motion)的研究越来越受到研究人员的重视。这一方法的巨大吸引力来源于它吸收了单目视觉设备简单和多目视觉的精确性两方面的优点。利用单个摄像机和对象之间的相对运动,以及有相对运动的条件下拍摄的连续几幅图像,就可以比较精确的恢复出对象的三维表面形状。而为了精确的恢复出对象的三维表面形状,就必须知道摄像机的内部参数。近年来,摄像机的自标定受到了普遍关注,成为计算机视觉研究的一个热点。这一问题的成功解决,将会成为计算机视觉研究的一个重大理论突破,对于由运动恢复形状等应用有着重大的意义,同时也会对计算机视觉的工程应用,特别是军事应用提供更加简单、易行、经济、实用的手段。
二、兴趣点检测
(一)兴趣点检测方法分类
目前的兴趣点检测方法大致可以分为四类:基于边缘的检测方法、基于灰度的检测方法、基于参数模型的检测方法以及基于局部能量的检测方法等。其中,基于局部能量的检测方法在频域空间内进行兴趣点的检测,避免了兴趣点形状的限制。它假定图像信号在其兴趣点处的傅立叶分量具有最大的相位一致性,而相位一致性正比于局部能量[1],故可通过计算局部能量来寻找这些兴趣点。这种方法的优点是可以检测到各种类型的兴趣点,而且定位精度也很准确。其主要缺点为:计算量相当大,而且也没有统一的阈值可用来标记兴趣点。
(二)一维对数-Gabor滤波器
为了有效地计算特征点的相位一致性,需要首先计算特征的局部能量。为此,这里简要介绍一下计算局部能量时所用的滤波器。
Field[2]提出了对数-Gabor滤波器,其转移函数为:
(1)
其中 为滤波器的中心频率。
由定义可知,对数-Gabor滤波器的直流分量为零,并且其转移函数一直向高频端延伸。此外,对数-Gabor函数也与人类视觉系统的细胞响应在对数频率尺度下的对称性这一特性相符合。因此,本文选用对数-Gabor小波来计算兴趣点的相位一致性。
(三)基于相位一致性的兴趣点检测方法
与传统的兴趣点检测方法一样,局部能量对于图像的亮度和反差较为敏感,不同图像计算得到的局部能量图具有很大差别,故兴趣点阈值的选取往往较为困难。另一方面,由于图像信号在其兴趣点处的傅立叶分量具有最大的相位一致性,故可以通过计算图像的相位一致性来检测图像中的兴趣点(即二维特征)。因为相位一致性是一个无量纲的量,其取值范围被标准化为0和1之间,并且相位一致性对图像的亮度和反差具有不变性,所以为特征显著性的度量提供了一个统一的方法。一维信号的相位一致性可表示为[2]:
(2)
其中, 和 分别为信号的傅立叶分量的振幅和相位, 为加权均值相角。
(a) 梯形边及其频域分量 (b) 三角波及其频域分量
图2 两种常见一维图像特征及其频域分量
图2给出了两种常见一维信号特征及其傅立叶展开式的前7项。由图可以看出,只有在图像特征点处,其频域分量才具有最大的相位一致性。
三、特征点匹配
当前,解决两视角下特征配准问题的方法可大致分为两类:连续的方法和离散的方法。对于特征匹配问题,存在两种不同的解决方案。第一种方案是,对于给定的图像序列,首先计算图像的速度场(如光流场),这里的每一个速度向量逼近不同图像中两点之间的相关性,因此,计算得到的速度场就对应配准的特征。第二种方案是,首先方面在每幅图像中提取特征点,然后利用某种方法进行特征的匹配。
连续的方法。这类方法直接计算图像的向量场,而不是进行显示的特征配准。计算得到的速度场就对应配准的特征,每一个速度向量逼近不同图像中两点之间的相关性。在实际应用中,光流场经常被用于逼近实际图像面中的速度场。这类方法要求帧间的运动较小,并且图像具有平滑的灰度函数。可以基于图像灰度函数的时空变化来计算光流场。尽管灰度流与3-D速度的投影并不完全相同,在某种假设下,它们非常相似。
离散的方法。这类方法允许图像间具有较大的运动。此外,由于离散特征较灰度值更为稳定,故离散的方法不受灰度值变化的影响,并且不要求图像灰度是连续的。
四、总结
近年来,随着光电子技术和数字序列图像处理及分析技术的深入发展,由运动恢复形状(Structure/Shape From Motion)的研究越来越受到研究人员的重视。此外,许多导航或控制任务,如目标跟踪、障碍避免或map building等需要摄像机(或目标)的运动参数和场景的欧氏结构信息。为了得到这些信息,我们必须首先确定摄像机的内部参数,即实现摄像机的标定。本文正是从摄像机标定过程的几个关键步骤入手,分别对特征点提取,序列图像中的特征点匹配以摄像机自标定算法进行了研究和讨论。
参考文献
[1]吴冠勇,摄像机内参数估计的若干研究.硕士论文:合肥,安徽大学,2004.
[2]David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach. Pearson Education,2002.
[3]马颂德,张正友.计算机视觉——计算理论与算法基础.北京:科学出版社,1998.
一、研究背景和意义
随着光电子技术和数字序列图像处理及分析技术的深入发展,由运动恢复形状(Structure/Shape From Motion)的研究越来越受到研究人员的重视。这一方法的巨大吸引力来源于它吸收了单目视觉设备简单和多目视觉的精确性两方面的优点。利用单个摄像机和对象之间的相对运动,以及有相对运动的条件下拍摄的连续几幅图像,就可以比较精确的恢复出对象的三维表面形状。而为了精确的恢复出对象的三维表面形状,就必须知道摄像机的内部参数。近年来,摄像机的自标定受到了普遍关注,成为计算机视觉研究的一个热点。这一问题的成功解决,将会成为计算机视觉研究的一个重大理论突破,对于由运动恢复形状等应用有着重大的意义,同时也会对计算机视觉的工程应用,特别是军事应用提供更加简单、易行、经济、实用的手段。
二、兴趣点检测
(一)兴趣点检测方法分类
目前的兴趣点检测方法大致可以分为四类:基于边缘的检测方法、基于灰度的检测方法、基于参数模型的检测方法以及基于局部能量的检测方法等。其中,基于局部能量的检测方法在频域空间内进行兴趣点的检测,避免了兴趣点形状的限制。它假定图像信号在其兴趣点处的傅立叶分量具有最大的相位一致性,而相位一致性正比于局部能量[1],故可通过计算局部能量来寻找这些兴趣点。这种方法的优点是可以检测到各种类型的兴趣点,而且定位精度也很准确。其主要缺点为:计算量相当大,而且也没有统一的阈值可用来标记兴趣点。
(二)一维对数-Gabor滤波器
为了有效地计算特征点的相位一致性,需要首先计算特征的局部能量。为此,这里简要介绍一下计算局部能量时所用的滤波器。
Field[2]提出了对数-Gabor滤波器,其转移函数为:
(1)
其中 为滤波器的中心频率。
由定义可知,对数-Gabor滤波器的直流分量为零,并且其转移函数一直向高频端延伸。此外,对数-Gabor函数也与人类视觉系统的细胞响应在对数频率尺度下的对称性这一特性相符合。因此,本文选用对数-Gabor小波来计算兴趣点的相位一致性。
(三)基于相位一致性的兴趣点检测方法
与传统的兴趣点检测方法一样,局部能量对于图像的亮度和反差较为敏感,不同图像计算得到的局部能量图具有很大差别,故兴趣点阈值的选取往往较为困难。另一方面,由于图像信号在其兴趣点处的傅立叶分量具有最大的相位一致性,故可以通过计算图像的相位一致性来检测图像中的兴趣点(即二维特征)。因为相位一致性是一个无量纲的量,其取值范围被标准化为0和1之间,并且相位一致性对图像的亮度和反差具有不变性,所以为特征显著性的度量提供了一个统一的方法。一维信号的相位一致性可表示为[2]:
(2)
其中, 和 分别为信号的傅立叶分量的振幅和相位, 为加权均值相角。
(a) 梯形边及其频域分量 (b) 三角波及其频域分量
图2 两种常见一维图像特征及其频域分量
图2给出了两种常见一维信号特征及其傅立叶展开式的前7项。由图可以看出,只有在图像特征点处,其频域分量才具有最大的相位一致性。
三、特征点匹配
当前,解决两视角下特征配准问题的方法可大致分为两类:连续的方法和离散的方法。对于特征匹配问题,存在两种不同的解决方案。第一种方案是,对于给定的图像序列,首先计算图像的速度场(如光流场),这里的每一个速度向量逼近不同图像中两点之间的相关性,因此,计算得到的速度场就对应配准的特征。第二种方案是,首先方面在每幅图像中提取特征点,然后利用某种方法进行特征的匹配。
连续的方法。这类方法直接计算图像的向量场,而不是进行显示的特征配准。计算得到的速度场就对应配准的特征,每一个速度向量逼近不同图像中两点之间的相关性。在实际应用中,光流场经常被用于逼近实际图像面中的速度场。这类方法要求帧间的运动较小,并且图像具有平滑的灰度函数。可以基于图像灰度函数的时空变化来计算光流场。尽管灰度流与3-D速度的投影并不完全相同,在某种假设下,它们非常相似。
离散的方法。这类方法允许图像间具有较大的运动。此外,由于离散特征较灰度值更为稳定,故离散的方法不受灰度值变化的影响,并且不要求图像灰度是连续的。
四、总结
近年来,随着光电子技术和数字序列图像处理及分析技术的深入发展,由运动恢复形状(Structure/Shape From Motion)的研究越来越受到研究人员的重视。此外,许多导航或控制任务,如目标跟踪、障碍避免或map building等需要摄像机(或目标)的运动参数和场景的欧氏结构信息。为了得到这些信息,我们必须首先确定摄像机的内部参数,即实现摄像机的标定。本文正是从摄像机标定过程的几个关键步骤入手,分别对特征点提取,序列图像中的特征点匹配以摄像机自标定算法进行了研究和讨论。
参考文献
[1]吴冠勇,摄像机内参数估计的若干研究.硕士论文:合肥,安徽大学,2004.
[2]David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach. Pearson Education,2002.
[3]马颂德,张正友.计算机视觉——计算理论与算法基础.北京:科学出版社,1998.