论文部分内容阅读
轮廓检测是计算机低层视觉感知的重要组成部分,在视觉处理任务中,如目标分割、目标识别、表面重构具有广泛的应用。对于视频中运动场景的轮廓与边界提取仍是一项非常困难的工作,主要难点在于:第一,视频中存在大量由背景所产生的局部边缘,而这些成分往往并不属于任何物体的轮廓和边界;第二,判断轮廓存在与否的基本假设和前提是场景中的感知线索存在局部差异,这些线索可能包括运动、亮度、色彩、纹理、立体视差、深度。基于生物视觉感知机制的轮廓检测方法在近年来受到了广泛的重视和应用。在视频轮廓检测方法中引入视觉处理机制不但可以有效的提高轮廓检测效果,而且可以更好的拟合人类的视觉特点。然而,轮廓感知的结果难以保证其产生封闭轮廓。通过图像分割对像素外观进行相似度标记形成与轮廓互补的区域块,可获得完整的区域边界,确保轮廓的闭合。我们给出一种改进归一化割方法,将轮廓感知结果转化为精确的区域标记结果,从而得到完整的闭合轮廓。因此,本文在仿生轮廓感知的基础上,研究轮廓封闭和区域分割方法,提高目标轮廓检测的完整性。本文主要开展了以下工作:(1)针对视频场景目标轮廓检测中因背景的局部边缘干扰导致轮廓虚警的问题,模拟仿生视觉感知中的非经典感受野建立运动能量模型,并采用运动能量抑制机制优化能量模型,能够有效解释视觉神经元的周围抑制感知特性;(2)在运动线索的基础上,加入亮度、色彩、纹理多种外观线索,优化组合多视觉线索计算边缘特征描述子,提升目标边缘强度,并依据随机森林的多重随机性提高边缘检测能力的多样性,进行多特征轮廓检测器的学习,生成视频帧的边缘置信度图;(3)采用降采样归一化割,对传统的归一化割方法进行改进,克服长特征向量的聚类引起的计算瓶颈,并考虑轮廓的全局推断,以减少图像分割过程的计算耗时;(4)在多尺度空间下对初始分割块进行层级校准,准确定位多个尺度下的区域边界,依据平均轮廓权值进行区域合并,将轮廓置信度图转换成超度量轮廓图,从而得到更准确的多层分割图,形成闭合轮廓。