论文部分内容阅读
计算机视觉中,从复杂场景中检测目标轮廓是一项重要而又面对挑战的艰巨任务。近年来,研究者们提出了大量的轮廓检测算法,但是,与人类视觉系统的轮廓认知相比,许多算法仍然无法检测到完整与精确的目标轮廓。在早期,Hubel与Wiesel就已经发现初级视觉皮层(V1)中的神经元对经典感受野(CRF)中特定位置出现的特定方向线段或边缘具有极强的敏感性。但是,神经元对刺激的响应并不仅仅受经典感受野的影响,同时也受到了位于非经典感受野(NCFR)区域内的神经元的相互作用影响。已有的研究表明,非经典感受野的神经元作用既包含了抑制,也包含了兴奋,这两种相互作用对有效消除目标背景或噪声具有关键作用。基于初级视觉皮层(V1)的感知机制,并结合神经元对不同频率的响应特性,本文提出一种结合多尺度抑制与上下文调制的轮廓检测算法。首先,利用多尺度、多方向的Gabor滤波器模拟初级视觉皮层中神经元对刺激的响应。对每个尺度内的多方向滤波响应,采用滤波器向量的方式提取基本轮廓。然后,对二维DOG滤波器进行扩展,形成具有可同时对尺度内与尺度之间进行非经典感受野抑制的三维滤波器(3D DOG),将3D DOG对多个尺度的基本轮廓进行卷积滤波,进而提取抑制结果。将不同尺度的抑制结果与不同尺度的方向特征分别进行整合,获取整合轮廓与整合方向。最后,将具有兴奋与抑制作用的上下文调制引入到非线性映射后的整合轮廓中,通过距离和方向构造的兴奋和抑制作用权,实现共线增强与纹理抑制,从而进一步增强整合轮廓的精确性。在对自然图像的轮廓提取定量分析实验中,与其它经典算法和当前一流方法相比,本文算法可有效改进轮廓提取的精确性与噪声抑制。本文的主要贡献有:(1)将滤波器向量之和引入到方向特征的提取中,提取的方向特征对上下文调制过程更具有效性。(2)通过构建3D DOG滤波器,以模拟对不同尺度下的神经元之间抑制作用,相比在单个尺度内进行抑制作用的2D DOG相比,3D DOG可更为有效地抑制背景噪声。(3)结合Weber-Fechner的非线性映射,通过可以同时实现共线增强和纹理抑制的上下文调制进一步提高轮廓检测的准确性。