论文部分内容阅读
分析图像边缘并提取形状特征是计算机视觉研究领域的一个基本课题,被广泛应用在形状匹配、图像分割、物体识别等视觉任务中。针对图像边缘分析,研究者们提出了大量行之有效的方法。其中,基于格式塔原理(Gestalt principles)的边缘感知组织(perceptual edge grouping)方法近年来成为研究的重点。该类方法基于认知心理学中关于人脑在感知过程中对接近性、连续性、平行性和对称性等显著性特征较为敏感的研究结论,对散乱的图像边缘进行聚合、连接得到具有一定语义的边缘轮廓。然而,传统的边缘感知组织方法只刻画了一般意义的显著性特征,并没有包含特定类别物体形状的先验知识。本文进一步研究:如何将物体形状相关的先验知识与边缘感知组织方法结合起来,将其扩展到提取特定类别物体的边界轮廓即物体分割问题中。根据同类别物体形状共有的结构特征,我们提出一种鲁棒的边缘结构模型,以概率形式描述图像边缘构成物体边界轮廓的置信度。模型利用统计学习方法从样本数据中训练得到。针对物体分割问题,我们还提出一种新的能量函数将边缘结构模型与传统的感知组织方法结合,得到一个全局最优的物体分割方法。具体地,本文的主要研究成果如下:1.提出了一种贝叶斯边缘结构模型(Bayesian Contour Structure Model,BCSM)。BCSM模型描述了观察到图像特征后一组边缘构成的子结构形成物体边界轮廓的后验概率。概率的方式比传统判别性的边缘结构模型更加灵活和鲁棒。BCSM模型是一种局部形状模型,与整体形状模型相比,能更好地处理物体自身形变、物体姿态或视角变化、以及遮挡等情况。为进一步增强模型的鲁棒性,BCSM模型在训练时没有采用如高斯等参数化模型,而是通过Boosting方法迭代地逼近物体边缘结构的概率分布。利用Boosting方法另一个优点是可以综合考虑几何、颜色和纹理等多种图像特征并做特征选取。通过样本的统计学习,BCSM模型可以描述物体类别相关的结构特征,而非一般性的感知显著性特征。实验证明,BCSM模型对物体形状特征有良好的描述性,同时对背景干扰边缘也有很好的区分性。2.设计了一种增量型的模型训练方法,以解决模型的小样本学习问题。BCSM模型在训练时需要一定量的已标注的样本数据。当物体可用的图像数据较少时可能会出现小样本问题。直接利用少量的已标注样本训练BCSM模型有可能出现过拟合(over-fitting)的情况,使模型的泛化能力降低。如何利用较少的已标注数据来扩充样本集合也是本文研究的内容。针对这种情况,我们提出一种增量型的模型训练方法。首先基于最小增量编码长度方法设计了一种有监督分类器算法。该分类器即使在小样本情形下仍具有良好的泛化能力,适宜于样本较少的数据分类。我们将该分类器应用于增量型BCSM模型训练方法中,在训练初期对未标注的样本进行分类,然后并入训练样本集合中,实现训练集的在线自动标注。3.在BCSM模型基础上,定义了一种新的感知组织能量函数,用于物体轮廓的提取。感知组织能量函数描述了物体轮廓的联合后验概率。我们假设各边缘子结构之间是统计独立的,将物体的整体轮廓的后验概率因子分解为该轮廓所包含的子结构的后验概率的乘积。因此在最大似然估计准则下,在图像中搜索最优的物体轮廓等价于最大化该联合概率。通过对数操作,我们将最大概率问题转化为最小化能量问题。研究表明直接最小化感知组织能量函数存在“小环”问题,即提取结果往往是图像噪声形成的没有价值的小轮廓。为减轻直接优化带来的偏差,我们利用轮廓的长度对能量函数进行归一化(normalization),因而最终得到的能量函数为一种比例形式,其中分子为描述物体轮廓的似然度,分母为轮廓的长度。为优化归一化的能量函数,我们以图像边缘构建了图模型,并利用最小比例环优化算法求解。由于该优化算法是全局最优,因而提取的物体轮廓为最大似然准则下的最优解。我们在自然图像中验证提出的基于BCSM模型感知组织方法用于物体轮廓的可行性。