论文部分内容阅读
众所周知,人类所感知的大部分外界信息都来自于视觉。研究人类视觉的认知机理建立视觉信息处理模型对推动计算机视觉的发展有重要的意义。计算机视觉领域是一个内容丰富涉及面广而且很有挑战性的研究方向,如何使机器通过视觉对外界进行感知和理解达到自主适应外界环境的能力还是个很大难题。从长远来看,计算机视觉研究的最终目的是建立一套可与人类视觉系统相媲美的通用视觉系统,如何通过生物视觉信息处理的启发建立可用于机器视觉的视觉模型是研究者们面临的挑战。本文依据这一背景,通过总结分析近年来依据生物视觉信息认知并在此基础上建立的可用于计算的生物视觉模型,并把这些模型用于计算机视觉领域的图像处理及物体识别,主要内容如下: 分析人类视觉系统的一些生理特性和机理,包括人眼的构成,视觉信息在视觉通路的传输,以及大脑皮层上的视觉信息处理区域。人类视觉系统被定义为视网膜和大脑区域之间的连接,也就是视觉通路。人眼首先通过视网膜接收外界的视觉信号,然后由人类视觉系统对接收到的视觉信号进行处理。由人类视觉系统处理的视觉信息,在大脑中按照一定的通路进行传递,在经过的多个神经区域上被处理,完成最后的认知过程。 上个世纪末期,研究者们对猫的视觉皮层上神经细胞进行研究,他们发现猫的视觉皮层神经细胞上存在同步脉冲发放现象,依据此现象他们建立了视觉神经元的同步震荡模型,后来又对其进行了改进。这种同步脉冲发放模型经过发展就形成了一种新型的神经网络模型即脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)。视觉皮层神经元同步振荡现象而建立的模型-脉冲耦合神经网络(PCNN)在图像处理方面有着很多优良的特性,如尺度不变性,旋转不变性,强度以及扭曲不变性等,PCNN在图像处理时只依靠图像的自然属性,实时性比较高。于此同时,本文利用PCNN简化模型并结合经典的中值滤波算法对图像去噪进行研究,实验结果表明两者之间的结合有效弥补了自身存在的不足,基于信息熵的自适应PCNN分割算法可以根据最大信息熵确定PCNN的迭代次数,分割后可以很好的对图像中的信息进行保留,可用于图像目标检测后的目标提取分割。 视觉注意是视觉信息获取过程中一项重要调节机制,人类在获取外界的视觉信息时会对不同图像信息进行分配加工。人类视觉的这种在处理大量复杂视觉信息时把注意力集中在显著性较强的物体上的特性称为视觉注意,视觉注意机制的研究,不但有助于探索人类视觉信息处理的工作机理,而且在图像分析领域中也有重要应用价值。如果能够将这种视觉注意机制引入到图像分析领域,将计算资源优先分配给那些容易引起观察者注意的图像区域,那么必将极大地提高现有图像分析方法的工作效率国内外学者对视觉注意机制进行了大量研究并建立了多种视觉注意模型,本文分析了几种经典的视觉注意模型,并在图像数据上进行了对比实验,根据得到的显著图以及计算效率进行对比,基于信息论的IG模型具有出色的表现,可用于显著目标的检测。 局部特征的提取,一般包括特征的区域检测和特征的区域描述,局部特征的描述一般要求具有亮度,尺寸和旋转的不变性。局部图像的特征基于图像的局部信息,通常以向量的形式表示,向量的维数直接影响到对后面的计算以及目标识别的速度。在局部特征识别算法上重点对SIFT,SURF,以及ORB算法的图像匹配性能进行对比实验,选取效率最高的ORB特征点检测匹配识别算法和视觉注意计算模型以及基于信息熵的自适应PCNN分割算法组成了有效的物体识别流程。最后利用脉冲耦合神经网络(PCNN)预处理后的图像经过视觉注意机制提取目标物体后设计了一套图像匹配识别系统。