论文部分内容阅读
视觉系统是人们获取外界信息的主要途径,也是人们获取知识和经验的主要感知器官。人脑视觉皮层是视觉系统的主要部分,主要完成视觉信息的加工、处理,实现对视觉知识的感知、学习、识别和存储(记忆)。随着智能科技创新和发展,对视频信息的处理成为当前计算机视觉研究领域的主要研究内容。其中视频信息中运动目标检测(MovingObjectDetection)是关键环节,也是后期视频处理的基础。因此,模拟视觉注意机制的视频信息处理成为认知计算与计算机视觉领域的重要研究课题。由于目前基于视觉注意机制的视频对象检测尚待完善,为此本文结合视觉系统生理学和心理学的研究成果,开展视频中运动对象显著性研究,实现全局运动下的运动目标检测,构建了一种脑启发式运动目标检测计算模型。 首先,构建了运动目标检测的基础框架。分析了移动镜头下运动目标检测存在的问题,并根据视觉初级皮层神经元及由神经元组成的神经网络属性,结合视觉整合理论,建立了移动镜头下运动目标显著性计算模型。 其次,提出了三维蝶型调制计算模型。根据视觉皮层神经元整合野的中心环绕易化和中心环绕抑制作用,构建了三维蝶型易化和三维蝶型抑制计算表达式,并给出了蝶型易化与蝶型抑制作用的动态平衡评估标准。 最后,提出了基于神经元整合野调节机制的特征整合方法。根据视觉皮层神经网络中神经元感受野的动态特性,通过结合神经网络的迭代过程实现对时空信息的整合,从而抑制了无关背景干扰,实现目标的完整性检测。 该运动目标检测计算模型对公开的目标检测数据库BMS、VIVID进行了测试,实验结果表明:建议模型能有效实现静态背景和动态背景视频中的运动目标检测,刚性和非刚性的运动目标均能较好地检测出来。