论文部分内容阅读
在模式识别和计算机视觉领域中,特征提取一直是难点之一,传统的基于特征的识别方法都预先定义一种特征,再依据定义的特征进行分类识别。深度学习作为传统机器学习的发展,因其基于样本数据,能逐层自动学习到更为合适的表示特征,而在众多领域得到广泛应用。 然而,传统深度神经网络学习模型使用基于数据的向量表示形式,当应用于图像等矩阵形式的表示数据时,需要把矩阵数据向量化,这样破坏了原有数据的空间结构,因此会丢失原始图像的结构信息。同时,经典的深度学习方法基本采用向量形式的输入、输出和全连接的权值。全连接的方式和多层的结构往往导致模型中含有大量待训练参数,从而需求大量的训练样本和非常苛刻的设备要求,时间复杂度也会随之增加。当训练样本不足时,常常还会因为过拟合问题而导致无法进行图像识别或处理。另外,要求获取大量的训练样本,在许多实际应用中很难做到。因此近年来基于张量数据的机器学习方法得到了众多学者的广泛关注。使用张量类型的数据,不但保留了其独特的空间结构信息,同时张量学习方法也可以有效的控制优化问题中变量的个数,从而克服了在向量学习过程中经常出现的过拟合现象,有效避免了维度灾难。目前,基于张量数据的机器学习新方法被广泛研究及应用,己成为当今数据挖掘领域的一个新的研究热点。 为了在深度学习过程中,保持高维数据的空间结构,减少学习训练中的模型参数,本文对当前经典的基于受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)的深度学习模型进行了改进。该模型不仅保持二维数据空间结构关系而且可以在训练样本较少的情况下达到很好的特征表示效果。本文的主要工作包括以下几个方面: 第一、提出了基于改进Fisher准则的深度卷积神经网络模型;该模型的能量函数中引入了改进的Fisher判别准则,在对卷积神经网络权值进行训练时,使得每次迭代时权值的更新调整不仅保证实际输出值和标签误差尽量小,而且还使同类样本距离更近、非同类样本距离更远。沿着这个目标不断更新迭代,训练出的深度网络模型权值更有利于分类和识别。当训练样本较少时,也可以达到理想的识别效果。 第二、提出了基于矩阵变量的RBM模型;经典RBM模型的输入输出数据采用向量表示形式,使其在实际用中具有很大局限性。为了使RBM能够直接处理矩阵数据,我们提出了矩阵变量RBM模型,该模型输入和输出层都是矩阵形式并通过双线性变换连接。新模型中的参数比经典RBM模型显著减少,因此模型训练和计算复杂度都有了明显改进。同时新模型可以通过少量的训练样本学习出较好的模型参数,提升表示能力,也有效避免了过拟合现象。为了让矩阵变量RBM模型得到更广泛的应用,我们将模型扩展成为多模态的矩阵变量RBM模型,张量变量RBM模型和矩阵变量深度置信网络模型。实验表明了这些模型的可行性与优越性。 第三、针对矩阵变量RBM模型参数训练问题,提出了基于张量CP分解形式的模型训练算法。该算法把张量形式的权值分解成若干个秩一张量的和,这种分解形式可以依据训练样本数据控制张量分解的秩一张量数量,得到权值更好的表示效果。并把此模型推广到深度结构和多模态结构,在图像识别、去噪、重构等实验中均取得了较好的效果。