基于深度学习的识别算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wq52131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别和计算机视觉领域中,特征提取一直是难点之一,传统的基于特征的识别方法都预先定义一种特征,再依据定义的特征进行分类识别。深度学习作为传统机器学习的发展,因其基于样本数据,能逐层自动学习到更为合适的表示特征,而在众多领域得到广泛应用。  然而,传统深度神经网络学习模型使用基于数据的向量表示形式,当应用于图像等矩阵形式的表示数据时,需要把矩阵数据向量化,这样破坏了原有数据的空间结构,因此会丢失原始图像的结构信息。同时,经典的深度学习方法基本采用向量形式的输入、输出和全连接的权值。全连接的方式和多层的结构往往导致模型中含有大量待训练参数,从而需求大量的训练样本和非常苛刻的设备要求,时间复杂度也会随之增加。当训练样本不足时,常常还会因为过拟合问题而导致无法进行图像识别或处理。另外,要求获取大量的训练样本,在许多实际应用中很难做到。因此近年来基于张量数据的机器学习方法得到了众多学者的广泛关注。使用张量类型的数据,不但保留了其独特的空间结构信息,同时张量学习方法也可以有效的控制优化问题中变量的个数,从而克服了在向量学习过程中经常出现的过拟合现象,有效避免了维度灾难。目前,基于张量数据的机器学习新方法被广泛研究及应用,己成为当今数据挖掘领域的一个新的研究热点。  为了在深度学习过程中,保持高维数据的空间结构,减少学习训练中的模型参数,本文对当前经典的基于受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)的深度学习模型进行了改进。该模型不仅保持二维数据空间结构关系而且可以在训练样本较少的情况下达到很好的特征表示效果。本文的主要工作包括以下几个方面:  第一、提出了基于改进Fisher准则的深度卷积神经网络模型;该模型的能量函数中引入了改进的Fisher判别准则,在对卷积神经网络权值进行训练时,使得每次迭代时权值的更新调整不仅保证实际输出值和标签误差尽量小,而且还使同类样本距离更近、非同类样本距离更远。沿着这个目标不断更新迭代,训练出的深度网络模型权值更有利于分类和识别。当训练样本较少时,也可以达到理想的识别效果。  第二、提出了基于矩阵变量的RBM模型;经典RBM模型的输入输出数据采用向量表示形式,使其在实际用中具有很大局限性。为了使RBM能够直接处理矩阵数据,我们提出了矩阵变量RBM模型,该模型输入和输出层都是矩阵形式并通过双线性变换连接。新模型中的参数比经典RBM模型显著减少,因此模型训练和计算复杂度都有了明显改进。同时新模型可以通过少量的训练样本学习出较好的模型参数,提升表示能力,也有效避免了过拟合现象。为了让矩阵变量RBM模型得到更广泛的应用,我们将模型扩展成为多模态的矩阵变量RBM模型,张量变量RBM模型和矩阵变量深度置信网络模型。实验表明了这些模型的可行性与优越性。  第三、针对矩阵变量RBM模型参数训练问题,提出了基于张量CP分解形式的模型训练算法。该算法把张量形式的权值分解成若干个秩一张量的和,这种分解形式可以依据训练样本数据控制张量分解的秩一张量数量,得到权值更好的表示效果。并把此模型推广到深度结构和多模态结构,在图像识别、去噪、重构等实验中均取得了较好的效果。
其他文献
虚拟手术技术是指利用各种医学影像数据和虚拟现实技术在计算机中建立一个模拟环境,模拟手术使医生能够借助虚拟环境中的信息来进行手术计划和手术训练,并在实际的手术过程中引
智能天线技术研究的核心是波束赋型的算法,但各种算法均存在计算量大和收敛速度较慢等缺点,如何提高系统性能成为一个重要课题。本文研究了智能天线波束赋型非盲算法中的最小均
网格研究作为一门新兴的研究领域,它的基本目的就是实现最大范围内的资源共享,提供协同计算能力.网格对资源进行了抽象,使之成为虚拟资源.而网格要解决的问题是对虚拟资源的
随着信息技术的高速发展和物联网的迅速普及,包括图像和视频等多媒体数字信号的海量感知数据呈指数增长,从而对现有的数据收集、数据处理、分类聚类等方法提出了巨大挑战。近年
论文选题来源于国家高技术研究发展计划(863计划)资助项目“黑客监控技术研究”、国家教育部博士学科点基金项目“智能分布实时网络入侵防御技术研究”。 随着网络对抗技
目前在开发网络设备的大规模数字系统过程中,仿真验证阶段自动化程度不高,以至投入的人力大、产品开发周期长.各个网络设备公司都在探索自己的一套仿真测试方法,没有公开的、
市场要求新的电子产品有更高的性能和更短的上市时间,这对集成电路设计能力提出了更高的要求.这种情况下出现了系统芯片(System-on-a-Chip,SoC)技术,即将一个完整的系统集成
在国家863项目"建设合肥网格节点及开发若干典型应用"的支持下,中国科学技术大学国家高性能计算中心、网络中心和科大生命学院分子计算实验室合作开发这个基于网格计算环境的
信息安全已成为社会各个领域迫切需要解决的重要问题,利用中国白主研发的电子密钥(硬件/软件)系统是中国需要尽快解决的紧迫任务.该论文结合国家863项目"高安全低能耗专用微
计算机可视化技术为我们提供了直观、有效、准确的医学分析手段,基于医学影像的器官三维模型重建就是其中十分重要的一个方面,它在外科手术计划、医学研究与教学、远程诊断分析