基于自动编码器的半监督表示学习与分类学习研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:renmin9999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以深度学习为代表的自动编码器表示学习在机器学习预测和识别领域取得了显著的成就。在现阶段以自动编码器为基础的表示学习研究中,大部分学习采用两阶段的学习框架,第一阶段为无监督的特征学习过程,第二阶段为有监督分类学习。在此过程中,为了适应训练数据,在第一阶段继承了特征学习良好性能的初始模型权重将在第二阶段的监督学习过程中,由于没有对原本特征的表示约束而发生改变。也就是说,第二阶段的有监督学习会降低第一阶段无监督特征学习的学习效果。同时第一阶段特征学习并未用到任何监督学习的信息,削弱了第二步监督学习时目标信息对于非监督学习的启示性为了充分发挥特征学习和监督学习的优势,本文针对两阶段学习框架会导致特征学习的效果会被削弱的缺点,提出了一种同时进行特征学习和有监督的分类学习的联合框架。同时在此框架的基础上,本文提出了半监督自动编码器模型——一种基于自动编码器的半监督学习分类模型,该模型不仅能确保在特征学习中得到的原始数据完整的“语义”信息,而且能在监督学习中很好的适应训练数据。另外,根据本文提出的半监督自动编码器模型,文章提出了求解该模型的BP算法,该算法将特征学习参数和分类学习参数同时进行优化,然后分别通过梯度下降方法对模型中的分类器和自动编码器的参数进学习。实验部分,本文使用MNIST数据集对分离学习框架和联合学习框架中,第一阶段特征参数的变化情况进行可视化验证,说明改进模型对特征学习效果的保证。同时使用了UCI机器学习数据库的四个公共数据集——图像分割数据集(Image),约翰霍普金斯大学的电离层数据集(Ionosphere),孤立的字母语音识别数据集(Isolet)和图像识别数据集(Lird)进行实验。实验中运用逻辑回归模型(Logistic Regression,LR)与分离学习模型(Disjoint Learning Model,DLM)作为基准方法与本文提出的半监督自动编码器模型(Semi-Supervised Auto-Encoder,SSA)进行比较,从分类的准确性、隐层神经元数量对分类效果影响、以及迭代次数、训练数据比例对分类效果的影响几个方面来充分验证半监督自动编码器模型的有效性。
其他文献
随着集群技术的发展,结点和链路的失效不可避免。因此,在有结点和链路失效下对通信终端间存在可靠通信路径的概率和所有正常结点的互通率进行研究就非常有必要了。由于网络中结
组合优化是运筹学的重要分支,主要通过对数学方法的研究寻找离散事件的最优编排、分组、次序或筛选等。大多数这类问题属于NP完全问题。当问题规模逐渐扩大时,其解空间呈组合爆
随着计算机网络的快速发展,网络协议测试技术成为人们日益关注的焦点,而如何才能设计出可靠的网络协议测试工具已经成为人们必须要面对的问题。为此,协议工程(Protocl Engine
互联网的快速发展使得 IP地址资源日渐枯竭。将IPv4地址空间升级为IPv6地址空间可以从根本上扩充地址空间,但还需要大量的升级换代工作;而另一途径是使用NAT(Network Address Tr
随着经济的发展,项目管理变得越来越重要。项目调度作为项目管理的重要组成部分,具有网络结构特点,各个项目成员分布在网络的节点上,负责整个项目的一项或几项工作,拥有各自的资源
协同过滤推荐算法作为推荐系统领域最成功的算法之一,为解决互联网时代信息过载问题发挥了重要作用。协同过滤推荐算法依据用户对项目的历史评分记录等偏好信息,通过计算用户
数据挖掘是一种高级的数据分析工具,通过分析所观察的数据集以发现可信的数据间的未知关系,并提供给数据拥有者可理解的、新颖的和有用的归纳数据。关联规则挖掘用于寻找给定
人工神经网络,又简称神经网络,是以生物神经网络的功能结构为基础而抽象出来的一种用于实现人工智能的数学模型。它是基于神经科学研究成果而提出的一种自适应、非线性处理系
Web服务是一种设计用来支持异构系统中的软件应用可以互相操作的技术,维基百科将Web服务定义为“一种服务导向架构的技术,通过标准的Web协议提供服务,目的是保证不同平台的应
无线视频传感器网络是由一组具有计算、存储和通信能力的视频传感器节点组成的分布式感知网络。无线视频传感器网络可以使人们在任何时间、地点和任何环境下获取大量信息,为野