论文部分内容阅读
视觉是人类最重要的感觉之一,它是一个极其复杂的感知和思维过程,人类所感知的外界信息中80%来自视觉。目前,人类的视觉注意机制因其能快速获取外界复杂场景的有效信息而成为研究的热点,其中视觉注意计算模型的构建是保证机器视觉系统有效工作的关键,而视觉注意单元的选择问题则是视觉注意计算模型构建的核心问题。首先,介绍了课题的研究背景,视觉注意理论及视觉注意计算模型的发展及现状,分析了知觉组织的发展和研究现状及其中的格式塔知觉组织原则,研究了人类的视觉信息处理机制。其次,通过将原始图像区域化,分别计算各个区域的均值、方差、幅度和亮度变化率等内部特征;采用中央邻域差算子得到图像中各区域与其邻域的差异特征图,最终将所有的特征图合并得到一幅显著图;计算显著图中各个区域的视觉熵,将熵值最大的区域作为视觉注意的焦点,利用人类视觉注意的抑制返回机制,实现视觉预注意焦点的转移这一系列的过程,提出了一个基于视觉熵的视觉预注意计算方法(VEVA)。再次,通过用Gabor能量作为经典感受野响应,以高斯差分函数为基础构造两个具有方向的半椭圆环来作为非经典感受野区域,设计中心感受野与周边抑制区域的相位差权重函数来模拟非经典感受野的抑制机制,构造出一种模拟视皮层非经典感受野的新模型。运用该模型对图像轮廓进行检测,并从定性和定量两方面对检测效果进行了分析。然后,依据拓扑知觉理论中格式塔的闭合性、连续性、接近性等规则,运用多尺度分析技术,将前面所检测出的轮廓进行编组,从而得到图像中物体闭合轮廓,建立了一个基于多尺度分析和最小夹角的物体闭合轮廓提取方法(MAMA)。综合以上内容,将显著区域和显著物体闭合轮廓进行有效融合,最终得到图像中显著物体轮廓,并把它作为视觉注意的单元,采用视觉注意中的抑制返回机制,实现视觉注意单元的转移,提出了一个基于空间和物体的视觉注意计算方法。最后,以并联雕刻机器人为应用背景,搭建了一种双目主动视觉监测平台。该平台具有人类视觉的双目及灵活转动功能,可对并联雕刻机器人工作空间实现多角度、大范围观察,将所提出的视觉注意计算方法用于该平台下的刀具检测及双目立体匹配,初步解决了视觉引导下并联雕刻机器人视觉系统的快速检测和准确定位问题,同时提出的计算方法对其它环境下的机器视觉系统也有一定的借鉴意义。