浅谈基于深度学习的卷积神经网络的特点和应用

来源 :锦绣·上旬刊 | 被引量 : 0次 | 上传用户:yiluyouyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文先介绍浅层神经网络的特点和应用,并指出其发展的瓶颈及不足之处;然后引入深度学习的概念,以卷积神经网络为例,详细介绍卷积神经网络的关键技术特点,最后通过一个实例说明卷积神经网络在深度学习方面的应用。
  关键词:多层感知机;深度学习;卷积神经网络;人工智能
  中图分类号:TP183:文献标识码:A
  0 引言
  在上世纪80年代,基于生物神经元数学模型的多层感知机(Multi-Layer Perceptron,简称 MLP)实现的网络模型就被叫作神经网络。由于当时的计算能力受限、数据规模较小等因素,神经网络一般只能训练到很少的层数,这种小规模的神经网络叫做浅层神经网络(Shallow Neural Network)。浅层神经网络不太容易轻松提取数据的高层特征,表达能力一般,虽然在诸如数字图片识别等简单任务上取得不错效果,但很快被90年提出的支持向量机超越。同时,浅层神经网络的发展遇到了很大的发展瓶颈。
  1 深度学习简介
  加拿大多伦多大学教授 Geoffrey Hinton长期坚持神经网络的研究,但由于当时支持向量机的流行,神经网络相关的研究工作遇到了重重阻碍。2006 年,Geoffrey Hinton 在 [1]
  提出了一种逐层预训练的算法,可以有效地初始化Deep Belief Networks(DBN)网络,从而
  使得训练大规模、深层数(上百万的参数量)的神经网络成为可能。在论文中,Geoffrey
  Hinton 把深层的神经网络叫做Deep Neural Network,这一块的研究也因此称为 Deep
  Learning(深度学习)。
  2 卷积神经网络简介
  2.1浅层神经网络的特点分析
  前面本文提到浅层神经网络是采用全连接形式的一种神经网络,這种浅层神经网络一般层数不多,但参数量在当时的计算机硬件的条件来说是非常庞大的。训练一个浅层的神经网络计算代价并不小,由此可见,全连接层较高的内存占用量严重限制了神经网络朝着更大规模、更深层数方向的发展。
  2.2 卷积神经网络的特点
  卷积神经网络作为深度学习的一个典型网络,通过充分利用局部相关性和权值共享的思想,大大地减少了网络的参数量,从而提高训练效率,更容易实现超大规模的深层网络[1]。2012年,加拿大多伦多大学Alex Krizhevsky 将深层卷积神经网络应用在大规模图片识别挑战赛ILSVRC-2012上,在ImageNet数据集上取得了15.3%的Top-5错误率,排名第一,相对于第二名在Top-5错误率上降低了10.9%,这一巨大突破引起了业界强烈关注,卷积神经网络迅速成为计算机视觉领域的新宠,随后在一系列的任务中,基于卷积神经网络的形形色色的模型相继被提出,并在原有的性能上取得了巨大提升。
  2.3 卷积神经网络的基本原理
  在数字图像处理中有一种基本的处理方法叫线性滤波[2]。它将待处理的二维数字看作一个大型矩阵,图像中的每个像素可以看作矩阵中的每个元素,像素的大小就是矩阵中的元素值。而使用的滤波工具是另一个小型矩阵,这个矩阵就被称为卷积核。卷积核的大小远远小于图像矩阵,具体的计算方式就是对于图像大矩阵中的每个元素,计算周围的像素和卷积核对应位置的乘积,之后将结果相加最终得到的终值就是该像素的值,这样就完成了一次卷积。
  如果采用卷积神经网络来替代以上提到的手写数字识别浅层神经网络,采用三个卷积层,和两个全连接层,一共只需要13450个参数,而且识别的准确率大幅上升。经过测试,可由原来的91%上升到98%以上。由此可见,卷积层的参数量非常少,主要的参数量集中在全连接层。由于卷积层将输入特征维度降低很多,从而使得全连接层的参数量不至于过大,因此通过卷积神经网络可以显著降低网络参数量,同时增加网络深度,大幅提高了识别的准确率。
  3 卷积神经网络的具体应用
  卷积神经网络可以应用在人工智能的很多领域[3],比如图像和自然语言处理等等。其结合特征提取和目标训练为一体的模型,能够很好地利用已有的信息对结果进行反馈训练。对图像识别的卷积神经网络来说,同样也是充分利用特征提取时提取的图像特征,来计算图像特征权重的大小,然后归一化处理需要处理的数据。这样使得原来的图像信息抽象成一个向量化的样本集,之后将样本集和训练好的模板输入卷积神经网络进行处理。下面以图像处理为例,说明卷积神经网络具体的编程方法和步骤。
  3.1 MNIST数据集介绍
  MNIST数据集是一个手写数字的数据库,它有60000个28*28像素的训练样本集和10000个28*28像素的测试样本集[4]。样本中包含了各个训练数据和相应的标签,其中标签集包含了0,1,2,3,4,5,6,7,8,9一共10个分类数据。通过对数据集的若干次训练,实现网络对输入数字图片的数字预测。
  3.2 数据获取及预处理
  本文使用的编程环境是TensorFlow 2.3,采用GTX1080 GPU进行训练,具体步骤如下:
  (1)数据获取
  首先使用TensorFlow 2.3本身自带的数据获取方式获得MNIST数据集并进行预处理。
  (2)数据预处理
  mnist数据集中每个实例的标签对应于0-9之间的任意一个数字,用来对图片进行标注,但这种标注方法并不能使得损失函数获得一个好的结果,因此数据预处理主要是先对数据标签(label)进行one-hot转换处理,处理之后就把常规的数字表示成0,1的形式,这种形式更适合进行损失函数的求解最小化。然后使用TensorFlow自带的data API进行打包,组合成训练集(train)和标签(label)的配对数据集。   3.3 建立卷积神经网络模型和结果分析
  基本的卷积神经网络模型是由卷积层、池化层、BatchNormalization层、dropout层以及作为分类的全连接层构成,同时每一层使用relu激活函数做分割。主要代码如下:
  (1)输入的初始化
  输入的初始化使用的是Input类,根据输入的数据大小,将输入的数据维度做成[28,28,1]的三维数据。
  (2)建立卷积层
  使用TensorFlow自带的卷积层实现类对卷积进行计算,通过设定卷积核的数量、卷积核的大小、padding方式和激活函数初始化卷积类。
  (3)建立BatchNormalization层和MaxPooling层
  BatchNormalization层和MaxPooling层的目的是输入数据正则化,增大模型的泛化能力。
  (4)建立分类的全连接层
  全连接层的作用是对卷积层所提取的特征做最终分类,先使用flat函数进行扁平化,最后使用softmax函数进行分类。
  (5)实验结果分析
  实验结果分析来看,经过15个epochs训练后,训练集的效果非常好,准确率达到了98.91%,但测试集在第4个epoch训练结束后准确率达到92.3%,以后就基本没有得到提高,说明存在一定程度的过拟合问题。
  (6)解决过拟合常规的办法
  a.正则化
  正则化是机器学习中最常见的过拟合解决方法,在损失函数中加入正则项来惩罚模型的参数,以此来降低模型的复杂度,常见的添加正则项的正则化技术有L1,L2正则化。
  b. Dropout
  Dropout是深度学习中最常用的控制过拟合的方法,主要用在全连接层处。Dropout方法是在一定的概率上(通常设置为0.5)隐式的去除网络中的神经元。
  c.Batch Normalization
  BM算法是一种非常有用的正则化方法,可以让大型的卷积神经网络快速收敛,同时还能提高分类的准确率,不需要使用局部响应归一化处理。BM算法会将每一层的输入值做归一化处理,并且会重构归一化处理之后的数据,确保数据的分布不会发生变化。
  d.增加噪声
  增加噪声是深度学习中的一种避免过拟合的方法,可以在输入数据上添加,增大数据的多样性,也可以在权值上添加噪声,这种方法类似于L2正则化。
  本实验采用了L2正则化和Dropout的处理过拟合方案,经过过拟合处理和参数调节后,使得训练集和测试集的曲线基本拟合,达到了预期的目标。
  4 总结
  本文先介绍浅层神经网络的特点和不足之处,进而引入深度学习的概念,并详细介绍了深度学习的典型网络-卷积神经网络的特点和应用,最后通过使用TensorFlow2.3建立卷积神经网络,对mnist数据集进行识别,从数据获取、数据预处理、建立卷积神经网络等一系列步骤进行说明,从运行的结果来看,卷积神经网络比传统的浅层神经网络大幅度提高了识别的准确率。
  参考文献
  [1] 王宇石等.一种基于卷积神经网络的违禁品探测系统及部署方法[J],科技创新与应用,2020(7).
  [2] 曹华军,吴宗民等.噪声图像的线性滤波分析与仿真[J],信息技术与信息华,2017(8).
  [3] 闫涛. 深度学习算法实践 [M]. 电子工业出版社出版社,2020.
  作者简介:翟高粤,男(1975-11)廣西钦州,汉,硕士,副教授,研究方向:软件理论,人工智能。
其他文献
摘要:现如今,我国各地区的环境污染问题严重,各类污染影响了人们的身体健康,为此对林业工程的关注程度也在大幅提高。而森林病虫害作为影响林业工程发展的重要因素,自然也受到了人们较多的关注,对林业工程森林病虫害进行防治成为了促进我国生态环境良好发展的重要组成部分。  关键词:现代林业;病虫害发生特点;防治技术  引言  在我国经济实力逐渐壮大,科学技术不断创新的今天,病虫害的发生具有破坏力大、范围广、传
期刊
摘要:随着简单重复的劳动被计算机代替和简化,图书馆的工作重点越来越转向为读者做“情报中介人”和“信息导航员”,对图书馆馆员的学识和专业能力的要求日益提高。在知识经济勃兴的今天,克服与读者之间的“文化障碍”,并实现“文化沟通”,越来越引起人们的关注。文化障碍主要是指图书馆馆员在计算机检索服务、互联网服务和专业咨询服务中,因对某些专业知识、科学概况的理解与读者的看法、要求不一致,导致服务不能令读者满意
期刊
摘要:传感器实验课程是一门新兴的学科,传感器也是当下物联网的关键技术,有着非常良好的应用前景。对于物联网工程及有关专业教师来说,在传感器实验课程中如何提高教学质量是值得深思的问题。目前,在传感器实验课当中还存在一些问题,为了提高学生学习效率,就可以选择应用PBL模式,以此来改善现状促进发展。本文就对基于PBL模式下的传感器实验课改革进行分析,供参考。  关键词:PBL模式;传感器实验课;改革  引
期刊
摘要:干部人事档案肩负着“存史、资政、育人”的使命。因为干部人事档案的重要性,新的时代,更需要我们把“严”和“实”摆在干部人事档案管理工作的首位,做好数字化建设,加强信息化管理,全面提升干部人事档案管理工作的科学化、规范化和信息化水平。  关键词:干部人事档案;数字化建设;信息化管理  一、强化宣传建设,提高思想认识  一方面加大对干部人事档案管理人员培训力度,通过培训提高管档人员业务能力和政治素
期刊
摘要:2019年末,一场突如其来的疫情使线上教学成为主流。线上教学使教师和学生面对面地互动交流,不受时间、空间的限制,打破传统课堂教学的多种弊端。基于移动互联网络,使教师和学生进行在线交谈,保证师生之间的互动。在移动互联网环境下,单纯线上教学也存在多种问题,应当积极探究线上线下相结合的教学模式,帮助学生充分运用互联网获得学习资源,提高教学的整体水平。  关键词:移动互联网环境;线上线下;学习模式 
期刊
摘要:教育的重要任务,不仅仅是向学生传授知识技能,更重要的是培养学生的品格。而课程思政所致力于构建的课程体系正是大学生的品格、境界、信仰塑造等精神性方面教育的关键点。本文从《网络工程导论》课程目标、开课时间和教学内容等方面说明了在该课程教学过程中融入思政教育的重要意义,并列举了重要课程知识点与思政教学内容的结合。  1 引言  高校思想政治教育历来承担着培养合格建设者和可靠接班人的重大使命。以往高
期刊
摘要:随着我国信息技术的飞速发展,网络技术已被广泛应用到教育教学中,并取得了较好的应用成效。网络技术支持下的教学活动,其与传统教学有着不同之处,它构建出一种全新的教学环境,不仅拓展了学生的知识视野,同时了突破了传统教学中的不足,让学生、家长、社会以及学校之间形成良好的互动,进而促进了生活与学习的联系,打造出理论结合实践的教学活动。基于此,本文主要阐述网络技术在教育教学中的影响,并分析网络技术在教育
期刊
摘要:现阶段我国煤矿产业发展较快,实现安全生产是维护煤矿产业稳定发展的重要保障,煤矿地质测量在煤矿安全生产中作用日益显现。煤矿地质测量是确保煤矿进行安全生產的重要前提条件,做好地质测量工作,才能使得安全生产的工作得到有效维护。本文对煤矿安全生产过程中煤矿地质测量的作用进行分析,旨在促进煤矿的安全生产,拓宽更大的经济效益。  关键词:煤矿安全生产;煤矿地质测量;作用分析  引言:地质测量是保障煤矿安
期刊
摘要:多媒体教学的运用可以使原来抽象、枯燥的学习内容通过图形、动画等形式而变得直观,增强学生的学习兴趣;由于多媒体教学系统具有交互性、集成性、和多维性的特點,因此,在教学中,能够尊重学生的个性,充分发挥教师的作用,实现教师与学生的双向交流;多媒体教学可以提高教学效率,在利用多媒体技术进行教学的过程中,教师可以在教室里利用遥控器对教室里的各种设备进行控制,从而通过对学生多感官的刺激使学生更利于对知识
期刊
摘要:随着网络信息的迅速发展,政府管理在互联网环境中面临着重大挑战。不适当的信息和舆论正在引起社会危机。促进当前管理,现有机遇和未来发展战略所面临的困难,有效地发展行政管理,提高政务效率,提高行政服务质量。本文分析了互联网环境中行政管理面临的挑战,并简要介绍了行政管理的机会和未来的发展。  关键词:互联网;行政管理;挑战;机遇  一、互联网环境下行政管理的挑战  1.在线信息自由化过多可能会引发民
期刊