论文部分内容阅读
随着机器学习和模式识别在互联网和多媒体技术的广泛应用,神经网络建模方法成为在计算机视觉领域重要的研究方向。然而,人类和动物的感知和认知过程是一个相当难解释的问题,视觉感知和视觉认知则是其中一个重要研究方向。目前,研究人类和动物视觉系统中感知与认知规律的研究相对较少,基于认知生理学机制和神经元内联一致性结构的视觉神经网络研究正获得越来越多的关注。通过对大脑皮层的自组织功能的模拟,生物启发的自组织映射算法成为解决计算机视觉问题的一种有效方法,并具有算法简单直观以及泛化能力强等优点。受到自组织映射算法的启发,通过将视觉神经网络加入自组织映射算法可以期望获得更好的特征表达能力。本文主要探讨自组织映射算法在视觉神经网络中的建模方法,并且对浅层视觉神经网络与深度视觉神经网络上进行对比。 本文研究如何将自组织映射算法应用于浅层视觉神经网络模型。在基于视觉认知神经网络的自动目标搜索和定位改进模型的基础上,加入了多维拓扑聚类结构,得到了基于多维拓扑聚类的视点运动控制神经网络模型,来解决目标搜索问题。新的结构是以模拟视觉系统中认知过程为理念构建而成,旨在让模型更加符合人类视觉认知的过程。 本文探讨如何以自组织映射算法构建深度视觉神经网络。通过融合卷积神经网络中局部连接、权值共享、采样汇聚以及多层网络的特性,构建一个基于自组织映射算法的深度视觉神经网络,来解决图像分类问题。基于自组织映射算法的深度视觉神经网络根据生理学基础,在层内建立具有大脑神经系统自组织特征映射功能的基本结构,在层次之间具有类似于人脑的分层模型结构。 通过在多个公开数据集上进行测试,验证了基于自组织映射算法的视觉神经网络的有效性,并表明模型具有较好的泛化性能。