基于人类视觉的识别系统研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:fc2sql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对特定场景中的目标进行识别作为图像理解领域的一个主要研究方向,具有重要的理论研究价值和应用场景。现实世界中的目标具有多变性,比如尺度变化、旋转、光照、物体遮挡等,复杂场景使得机器视觉系统中的目标识别更加困难,而且在应用过程中,人类构建的特征往往都是基于任务的,有一定的盲目性和片面性,所以当前人们研究的热点,主要集中在如何让机器具备人类视觉,能够快速定位目标方面。本文通过对生物科学的最新研究成果进行分析,受到灵长类动物视觉神经系统的启发,详细对HMAX模型和卷积神经网络模型的结构进行阐述,找到模型与生物视觉系统模型的生物功能联系,以生物启示的方法来指导场景中的目标识别,引入更能刻画目标本质特征的深度学习模型。而卷积神经网络作为深度学习模型的一种,能直接从灰度图像学习出抽象的高级特征,具有强大的图像分类能力,但是在特征组合过程依然存在着使重要特征稀疏的问题,对此,通过对卷积层卷积运算过程的改进,解决特征组合过程中因为卷积多个输入特征图而使重要特征稀疏的问题。将改进后的卷积神经网络应用在手写数字数据中,与主流的分类方法进行比较,结果表明改进后的卷积神经网络准确率较高。  论文的研究内容主要包括:  (1)概述灵长类动物视觉皮层感知机制,通过分析脑科学等当前的一些新的研究成果,作为HMAX模型及卷积神经网络模型的生物理论基础支撑,寻找模型生物功能联系。  (2)综述特征选择方法,对特征的提取及描述作简单介绍,对现有的人类构建特征做分析,指出构建特征必须基于人类先验知识以及对于不同任务构建特征的盲目性。以此引出深度学习在提取更本质特征方面的优势及意义。  (3)深入研究深度学习中的卷积神经网络理论,分析卷积神经网络的层次结构,在视觉系统及卷积神经网络中寻找共同点,作为卷积神经理论的生物启发依据。结合HMAX模型子采样层max-pooling机制的优势,对卷积神经网络子采样层进行修改,解决深度学习运算量大的问题,减少层间计算复杂性和增强平移不变性。  (4)构建稀疏卷积神经网络,通过卷积神经网络在训练过程中学习特征图的组合,让网络智能挑选特征图作为下一层的输入,主要是在卷积运算前引入稀疏规则限制,让算法自动选取部分前一层特征作为输入。解决特征组合过程中因为卷积多个输入特征图而使重要特征稀疏的问题。  (5)将改进的卷积神经网络应用在手写体数字识别上。并与原来的卷积神经网络及其它主流分类算法进行对比验证,分析结果。
其他文献
随着信息技术和计算机技术的迅猛发展,人类进入了信息时代。网络教育是信息时代的必然产物,它使教育突破了时间和空间的限制,使人们可以随时随地的进行学习,最大限度利用教育资源
本文以高校校园网络系统的现状为背景,来探讨一个基于数字化校园分布式系统统一用户权限管理系统的设计与实现。全文结构如下: 第一章首先介绍了论文的选题背景及意义,根据用
随着互联网技术的飞速发展,文本数据大幅度地增长,如何利用计算机从大量复杂的文本中获取有用的信息,借助语义相关度计算是解决这一问题的途径之一。词语作为句子和文章的基础,其
随着国家信息化进程的发展,各政府部门也开始了政府部门电子化的过程。目前,我国政府的电子化进程已经处于世界中上等水平。 当今信息技术的发展,一方面给人们的生活带来了巨
本文结合基于关键点路径的地形跟踪系统的自身特点,以飞行物为模拟物体,研究实现基于关键点路径的地形跟踪系统所需的相关技术,并进行系统原型设计和技术实现。全文主要内容如下
本文对粒子群优化算法的产生、发展进行了介绍,讨论了多目标演化算法的相关重要策略,并分析了多目标粒子群优化的发展现状。在此基础上,借助多目标演化算法的相关策略,设计了两种
本文在分析考察传统的金融预测分析方法的基础上,提出了一套面向期货市场分析、预测和决策,针对实盘真实数据操作,由BP神经网络和ARIMA时间序列模型组合的系统应用模板。该系统
如何将测试工作量合理分配到软件模块以有效检测缺陷是软件开发组织面临的重要挑战。结构复杂性导向(SCA,structural-complexity-guided allocation)和缺陷预测模型导向(FPA,
本文首先从集群系统的基本技术入手,介绍了Beowulf集群的基本体系结构,之后分析了南开之星集群的体系结构和关键技术,针对科学计算集群的特点,提出了科学计算集群性能监测系统的
本文通过一个基于MVC(Model-View-Controller)模式的J2EE项目来探讨体系结构级重用的可行性及实用性。 MVC模式把应用程序拆分成三个部分:模型、视图和控制器。其中模型表