基于生物认知机制的视觉分类算法及其应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xmzhkj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉是人类认识和理解世界的首要途径。长久以来,人们都希望能够在人工系统上复刻人类的视觉能力。其中,视觉分类是最受关注,最为核心,也是实现起来最具挑战性的视觉功能之一。同时,从实用角度看,人工视觉分类系统对于解决智能机器人,人机交互,信息检索,安全监控等应用领域中的关键问题也具有不可替代的重要意义。  在过去的十年中,伴随着图像处理,机器学习,模式识别等相关技术和领域的进步,视觉分类研究取得了一系列的标志性成果。然而,人工视觉分类系统与生物视觉系统在准确性,泛化性,稳定性和学习效率等方面依然存在着巨大的差距。与此同时,神经科学领域关于生物视觉认知机制的研究为建立更为有效和灵活的人工视觉系统提供了许多新观点和新思路。以此为出发点,本文开展了基于生物视觉认知机制的视觉分类算法和应用研究,主要贡献包括:  1.以生物视觉认知模型中常见的层级结构和最大池化机制为基础,设计了一种适用于二分类任务的结构化的分段线性分类器,并给出了相应的训练算法。相比于视觉分类任务中通常采用的线性分类器,本文所提出的新的分类器形式具有更高的分类正确率,并对常见的类别内样本的外观差异具有更好的不变性。相比于核分类器,新的分类器形式在取得相当正确率的情况下明显提高了分类过程的计算效率。  2.基于前一步工作所设计的分类器形式,通过加入模仿高级视皮层中神经元之间关系的最大池化层,对一种生物视觉认知模型-HMAX模型进行了改进。同时,依据新模型特点,本文提出了相应的特征选择方法,增量式的分类器初始构建方法和精细的模型参数优化方法,进一步地提升了新模型的分类效果。在自然图像的分类任务中,新模型取得了高于原有模型和其他改进模型的分类正确率和计算效率。  3.根据生物视觉认知模型的基本特点,提出了一种基于重构误差的判别性多子空间学习算法。通过在传统的无监督多子空间模型中引入适当设计的判别项,本工作提出的学习算法能够产生具有显著判别性的多子空间模型,且模型所预测的样本类别归属和子类别归属能够以重构误差的形式直观地体现出来。该模型为基于生物视觉认知机制的分类系统中匹配层的设计提供了更为灵活的选择。  4.将传统的视觉分类算法框架与关键的生物视觉认知机制相结合,提出了一种适用于小样本分类学习任务的视觉分类浅层模型。同时,本文进一步论证了该模型相当于一种包含隐含变量的视觉分类的概率推断模型。对于模型所包含的分类器,特征变换和特征模板的学习问题,本文分别提出了相应的有监督或无监督学习算法予以解决。在小规模自然图像数据集上的实验表明,相比于传统图像分类方法,在采用同样的局部图像特征的情况下,新的分类系统能够更高的分类正确率。  基于以上工作,本文对于生物视觉认知机制在视觉分类问题中发挥的作用进行了分析和总结。同时,相关的模型为建立更为复杂的深层结构视觉认知模型提供了基本的单元模块和算法,对进一步设计高性能的生物启发式的视觉分类方法和系统具有很好的借鉴意义。  
其他文献
HART智能设备以其兼容(4-20)mA模拟信号且具备数字通信功能的优势获得广泛的应用。数字通信的功能使其能够实现在线的监测、诊断、校验等。构建HART数字通信网络,实现HART设
随着高清摄像机在智能交通系统中的推广应用和图像处理技术的发展,基于图像的检测技术已成为最重要的车辆检测方法之一,并得到广泛的研究,在车辆检测准确率上不断提高。但是在城
脑作为人类神经系统的中枢,是一个精细、复杂和高效的系统,控制着人类的情感、思维和行为。探索脑的结构和功能、揭示脑的工作机制,是重大的科学前沿。现代影像技术的发展为人类
近年来,层次短语翻译系统逐渐成为实用的统计翻译系统之一。通过引入形式化的句法结构,层次短语翻译系统能够有效处理短语翻译系统所面临的长距离调序、规则泛化等问题。由于层
学位
随着互联网技术的快速发展,多样、异构、稀疏、海量的数据呈指数级快速增长。如何有效地表示和深入理解这些大数据已经越来越受到人们的重视,甚至已经成为当前的重要研究课题。
随着移动互联网的迅速扩张,网络购物大大地提升了人们的生活质量。在此背景下,许多电子商务网站提供了产品评价平台,以方便用户分享产品使用经验以及对产品的满意程度作出评价。
随着计算机和网络技术的广泛使用,网络安全防护成为一个研究热点。入侵检测技术是保障网络安全的重要手段,基于人工智能算法的入侵检测方法成为了当前网络安全领域的重要研究课
胶囊内窥镜的出现和发展,为小肠疾病患者提供了有效而低痛苦的检测手段。然而,胶囊内镜同时也有低效、漏检的缺点,甚至存在一定的危险性,因此,现实需要发展胶囊机器人技术,赋予胶囊
随着工业开始朝着大规模、复杂化的方向发展,针对工业生产的过程监控和故障检测成为了工业系统中备受关注的问题之一。如何从大量数据中挖掘出隐藏的有用信息,使其能够服务于