论文部分内容阅读
在人的视觉感知、识别和理解中,形状是图像中目标的基本内在特性,是用于目标识别的重要特征,因此基于形状的图像匹配、目标识别方法研究具有重要意义。针对不同的研究目的,人们已经提出了许多种不同的形状匹配方法,如:k邻接分割(kAS),金字塔匹配,形状上下文,基于内积的形状上下文等。形状的描述及其表达依然是一个开放性问题,其中最困难的问题是缺乏对于形状这一概念的清晰的定义。虽然,形状的轮廓能够通过参数曲线,例如:傅立叶系数等来表示,但是,这些数学方法难以解决我们在描述和比较不同形状时所遇到的问题。例如:谱图理论在图像分割中得到了广泛的应用,但是,在应用到3D图像匹配时却需要对尺度进行归一化;而形状上下文描述子也受到各位学者的推崇,但是却依赖于对目标轮廓的检测。
本文的目的在于探索新方法来描述和比较目标的形状,并且应用到形状匹配和识别等方面。因此,本文首先系统地分析了目前较流行的几类形状描述算子,并比较了它们的优缺点。接下来详细介绍了我们基于谱图理论,以及形状上下文描述子的工作。本文的主要工作和贡献可以概括如下:
1.提出了基于特征向量直方图匹配的形状匹配算法
这部分工作主要基于D.Knossow等人基于谱图理论的模糊匹配的工作展开的,由于图的Laplacian矩阵同时包含了形状轮廓的局部和全局信息,我们通过Laplacian矩阵的特征向量直方图来表示2维形状轮廓。但是,谱分析本身存在许多难点,例如,如何有效的进行特征值排序,为了克服上述问题,我们引入子矩阵匹配的方法来对由不同尺度图形的特征谱定义的特征空间匹配。通过设定恰当的距离度量方法来比较两个形状之间的相似性。通过在图像数据库MPEG-7CE-Shape-1上随机选取的两组图像的相似性实验,组内距离平均缩小了0.152,组间距离平均缩小了0.037,有效增强了图像间的区分度。
2.提出了基于夹角直方图的形状匹配算法
为了避免上一章方法中因计算特征值和特征向量而引起的高计算量,这一章我们基于S.Belongie等人的形状上下文描述子,进行了相关的改进。首先我们选取轮廓上的局部曲率最大值作为特征点,形状轮廓的中心作为参照点,计算给定特征点相对其他所有点的夹角,从而每个特征点可以表示为相对其他点的角度直方图。所有特征点的直方图可以作为形状的全局描述子,进行形状相似性比较。最后,我们在图像数据库MPEG-7CC-Shape-1上的图像匹配实验仅仅消耗15分钟左右,运行效率得到了极大的提高。