基于深度学习的图像分类

来源 :北京邮电大学 | 被引量 : 23次 | 上传用户：qingtianleng

【摘要】

：

最近几年随着深度学习技术的飞速发展,机器学习算法的性能得到了大幅提升。深度学习技术作为一种非常有潜力的机器学习算法,正潜移默化地改变着我们的生活方式。深度学习模型

【作者】

：

孙炜晨

【出处】

：

北京邮电大学

【发表日期】

：

2017年01期

【关键词】

：

深度学习激活函数模型参数初始化方法卷积神经网络正则化联合目标函数图像分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

最近几年随着深度学习技术的飞速发展,机器学习算法的性能得到了大幅提升。深度学习技术作为一种非常有潜力的机器学习算法,正潜移默化地改变着我们的生活方式。深度学习模型,像卷积神经网络(CNN),递归神经网络(RNN)和长短期记忆人工神经网络(LSTM)等,已在计算机视觉、语音识别、自然语言处理等领域得到了广泛的应用和关注,推动了相关领域的发展。在数据量呈爆炸式增长的时代,为了充分发挥大数据的优势,挖掘数据中潜在的规律和信息,如何有效地训练更深、更复杂的神经网络模型已经成为了学术界和工业界共同关注的问题。深度学习技术通过无监督预训练的方式在一定程度上缓解了深度神经网络模型的训练困难,但是在发掘深度神经网络巨大的潜能上,仍然存在着一些亟待解决的难题:(1)梯度消失和梯度爆炸。这两个问题普遍存在于使用基于梯度方法(比如反向传播算法)训练深度神经网络模型的过程中,由于梯度在传播过程中的不断衰减,使得模型低层的参数不能得到充分地训练,随着模型深度的不断增加,这种情况变得更为严重。(2)过拟合问题。由于模型同时拟合了训练数据中的潜在分布和噪声,而其中的噪声对测试数据并不适用,造成了模型在测试数据上性能可能下滑严重的现象,影响了模型的泛化能力。本文将从非线性激活函数、模型参数初始化方法和正则化方法三个角度来缓解上述深度神经网络模型训练的难题。论文的主要工作和贡献如下:1.提出了一种使用多层 Maxout 网络(Multilayer Maxout Network,MMN)的非线性激活函数,同时继承了非饱和激活函数和训练数据驱动的特性,能够拟合任意形状的非线性激活函数。MMN激活函数的一个主要优势在于可训练的特性和逐段线性的结构,可以缓解反向传播过程中出现的梯度消失问题;另一个主要优势在于MMN激活函数的多层结构,能够与端到端训练相结合,提高卷积神经网络模型的特征表示能力。2.通过理论分析深度神经网络模型的前向传播和反向传播过程,提出了一种基于MMN激活函数的模型参数初始化方法,这种初始化也适用于Maxout激活函数。在CIFAR10, CIFAR-100和ImageNet图像分类数据集上的实验结果证明本文所提出的模型参数初始化方法能够降低信号在隐层之间传播时隐层分布的变化,从而有效缓解深度神经网络模型训练过程中遇到的梯度消失和梯度爆炸问题。3.提出了一种基于联合目标函数的正则化方法,通过增加辅助监督信息,对深度神经网络模型的训练起到正则化的作用。本文提出的这种基于联合目标函数的正则化方法具有以下三个方面的优势:(1)联合目标函数包含两类辅助监督信息,分别是对卷积核参数的辅助监督信息和对非线性激活函数的辅助监督信息,两类监督信息都能有效缓解模型的过拟合问题,提高深度神经网络模型的性能,其中对非线性激活函数的辅助监督信息效果更加明显;(2)通过在预训练阶段使用结合了辅助监督信息的联合目标函数,深度神经网络模型的低层能够学习到更具区分性的特征,为后面端到端的有监督调优过程寻找一个更优的模型参数初始状态;(3)这种基于联合目标函数的正则化方法具有很好的通用性,能够和诸如dropout、数据增强等正则化方法结合使用,缓解深度神经网络模型的过拟合问题。

其他文献

BIM技术在铁路预制梁场规划与布置中的应用研究

铁路预制梁场作为铁路施工建设重点大型临时工程,其规范布置和合理规划对保证进度和控制成本起着极其重要的作用。本文将BIM技术应用于铁路预制梁场,建立铁路预制构件Revit族

期刊

高速铁路预制梁场规划布置BIM

甲型H1N1流感的流行与应对

2009年4月份以来,美国、墨西哥等国家发生了甲型H1N1流感流行,并已发生了人传人暴发疫情,迅速蔓延到多个国家和地区。世界卫生组织已宣布此次疫情为“具有国际影响的公共卫生

期刊

流感病毒A型疾病暴发流行应对策略

高港千名干部进村入户大走访

本报讯 (通讯员卞小士曹春荣黄艳) 近日，高港区的大街小巷、田间地头和群众家中，活跃着近千名干部的身影，他们正深入基层群众中，听民声、访民情、察民意，广泛宣传解释政策措施，积

报纸

铜铝价差的缩小预示着什么?

近几年来,随着国内外铜铝价格的相继走低,同时出现了两个交易品种价格不断接近的情况。如1995年6月至7月份,上海金属交易所铜价为每吨3.2万元,铝价为每吨2万吨。两个交易品种

期刊

价差国内外铝价价格差距铜价有色金属价格比百分点月份交易品种

关于CAE技术在汽车车架设计中的应用

汽车车架是汽车的主要承载体,承受多种载荷,对整车的使用寿命和安全有着重要影响。在整车设计时,必须对车架强度进行分析。利用CATIA软件进行汽车车架零件CAD建模,结合CAD模

期刊

有限元分析车架结构

基于Unity的《KillHim》手机游戏设计与实现

随着互联网的蓬勃发展,及智能手机产业的空前繁荣,手机游戏渐渐在人们的生活中的分量越来越重要,俨然成为了人们的一种生活方式。本项目是基于Unity开发的一款手机游戏,该游

学位

Unity游戏美术手机游戏UI构架设计

有关部门对钨业生产经营秩序清理整顿情况进行检查

日前,国土资源部办公厅、国家经济贸易委员会办公厅以国土资厅发[2000]15号文件发文《关于对钨业生产经营秩序清理整顿情况进行检查的通知》通知地区包括:内蒙古、福建、江西

期刊

清理整顿经营秩序钨业贸易委员会有色金属行业有色金属工业行业主管自治区国土资源部国家经济

进口自用设备不予免税目录有调整

记者从财政部获悉,经国务院批准,从2000年10月1日起,我国将执行新修订的《国内投资项目不予免税的进口商品目录》,这意味着2000年10月1日后新批准的国内投资项目进口设备是否

期刊

商品目录国内投资项目进口设备生产企业免税新修订进口商品同类产品竞争力先进设备

利用陶瓷工业废料制备再生陶瓷墙地砖

以废弃陶瓷抛光砖粉、陶瓷墙地砖烧成废料为原材料,硼砂作辅助熔剂制备再生陶瓷墙地砖,研究陶瓷抛光砖粉的高温烧结性能及其对再生墙地砖强度的影响,采用SEM测试分析陶瓷抛光

期刊

陶瓷抛光砖粉硼砂陶瓷墙地砖强度

一周有色金属市场评述(2000年8月14日-19日)

期铜周评LME三月期铜概况:开盘1871美元/吨,最高1900美元/吨,最低1867美元/吨,收盘1886美元/吨,较上周+16美元/吨,成交量279151(手),持仓量162211(手),库存量450025(吨),较上

期刊

库存量铝市场库存减少继续保持锌价美元放缓金属市场铝价技术分析

基于深度学习的图像分类

与本文相关的学术论文