论文部分内容阅读
视觉认知作为脑科学及认知科学分支之一,主要的研究工作就是探索大脑内部的视觉信息处理是在何处如何进行的。从事模式识别的人更加关心大脑是如何处理视觉信息的,他们利用神经生理学的最新研究成果建立起了基于认知的机器视觉,主要研究在视皮层视差检测中的眼动机制和视觉注意机制。到目前为止,这两种算法视皮层视差检测机制和视觉注意机制都是处理各自领域的,并没有真正的交叉融合起来,这两者的融合是立体视觉认知中需要进一步解决的问题。本文针对以上问题进行了探索和研究,在借鉴前人的研究成果基础上提出新方法,并通过实验证明了所提方法的有效性。论文的主要工作包括以下几个方面:(1)将视皮层视差检测机制和视觉注意机制放在同一个框架下来研究。视皮层视差检测机制的研究目标是通过认知的计算模型从二维图像中获取三维环境信息,而视觉选择机制则研究的是如何利用物体与周围环境的颜色,形状等信息模拟主体在海量的视觉信息中视觉焦点的提取和转移。本文通过分析两者间内在联系和相互关系,并将其统一至同一框架中进行研究。然后结合亮度,颜色,方向等特征引导的自下而上的视觉注意计算模型来提取有意义的物体信息并把信息反馈到视差检测模型,对视差检测模型中加以指导。(2)提出视皮层视差检测机制中置信点扩散算法。认知神经科学指出视皮层视差检测机制中位置差和相位差同时存在,这为视差能量模型理论提供了支持。本文结合了视皮层视差检测的最新研究成果和传统视差理论的约束条件,以图像平移模拟眼动机制实现位置差检测的计算模型,使用一维Gabor滤波器提取相位来实现相位差的计算模型,最后通过概率学的内容,对眼动过程中提取的所有的深度加以判定和选择生成视差图。并在视皮层视差检测机制中融入了置信点扩散的算法,对生成的视差信息加以判断和修订。实验结果表明置信点的提出可以降低误匹配率。(3)视觉注意下的眼动机制。在传统的视皮层视差检测机制中,并没有考虑眼动机制的约束和限制,传统的图像平移包括了整个视差可能出现的范围,没有发挥大脑的能动性。结果造成了计算量大、视差信息臃肿等缺点。本文利用提取的视觉注意焦点对眼动机制加以控制,在眼动的过程中利用视差能量模型检测视觉焦点的匹配结果,从而大大的减少了匹配的计算量。(4) BPA算法在重建三维场景中的使用。BPA算法是一种在三维空间建立标准化三角网的算法,算法有着高效性和鲁棒性,广泛的应用在人脸重建等领域。本文把这种算法的应用范围加以扩展,在场景重建中使用了这种算法。结果表明,该算法在场景重建中也有着很高的可靠性和有效性,完全可以满足场景重建的需要。