论文部分内容阅读
多媒体技术的发展、计算机运算速度和存储容量的提高,使图像成为计算机信息处理的重要内容,而数字图像获取设备的普及产生了大量图像资源。根据形状特征的相似性识别和定位物体是计算机视觉研究的基础之一,主要目的是分析和发现物体模型与图像特征之间的匹配关系,以便有效地应用于各种图像分析与检索系统。本文主要研究基于形状特征的图像内容提取和识别。 本文提出了一种高效的、基于形状特征的物体识别与定位算法,包括图像形状特征的提取、物体模型与图像特征之间的匹配以及识别等方面的内容。 描述形状特征的方法很多,其中基于边缘线段的形状描述方法既足够抽象,又能提供丰富的信息,是描述形状的最佳方式之一。该方法用物体的边缘线段描述其形状特征,边缘线段具有多种属性,包括位置、长度、方向、宽度、边缘线段两端图像特征的对比度和倾斜度等。 物体模型是先验知识和处理目标共同决定的物体形状特征,由具有特定属性值,或一定属性值范围的边缘线段的集合构成,由手工绘制而成。 图像特征提取本质上是边缘线段的提取及其属性计算问题,处理过程中综合运用了全局分析与参数控制等思想,在线段支持区域的基础上,能够高效、准确地计算包括位置、长度、方向在内的多种边缘线段属性,如边缘线段两端图像特征的对比度和倾斜度等,为形状描述和识别提供了丰富的信息,可以极大地提高物体模型与图像特征匹配与识别的速度和精度。 物体模型与图像特征之间的匹配主要是如何定义和计算相似程度的问题。本文采用匹配误差率与匹配丢失率之和计算两者之间的相似程度。匹配误差率表示物体模型与图像特征之间的吻合程度,由最小二乘法计算而得。由于边缘线段提取过程中可能出现断裂现象,因此匹配算法允许一条模型线对应多条边缘线,也允许一条边缘线对应多条模型线。匹配丢失率体现了在物体模型与图像特征的匹配过程中,模型线上没有实际的边缘线对应的部分在模型线段集合总长度中所占的比例对最终匹配是否成功的影响程度。 贪婪搜索是实现物体定位的有效手段,通过迭代推进和随机采样获得概率意义上的全局最优匹配。子集收敛法是贪婪搜索的一个变种,相对于其它算法,获得全局最优匹配的概率更高,尤其是在图像特征高度断裂、物体模型对称,以及图像上存在多个对象实例的情况下,效果尤其突出。