论文部分内容阅读
深度学习是人工智能领域发展的一个重要组成部分,深度学习在许多领域(如图像识别、语音识别、自然语言处理)取得了突破,在传统算法不易解决的应用方面也取得了令人可喜的成就,包括自动无人驾驶汽车、自动模式识别、自动同声传译、商品图片检索、手写字符识别、车牌自动识别等。近年来,随着研究开发人员对于深度学习开发过程要求的不断提高,传统的深度学习编程方法已经不能满足当前的需要,传统的深度学习编程方法会耗费研究开发人员数月甚至几年的时间用来实现最基本的算法,与此同时,一些世界顶尖的科研机构开始寻求快速、高效的深度学习开发模式,因此就产生了包括本文研究的Caffe深度学习框架在内的多种深度学习开发框架。这些深度学习框架不仅为科研机构、相关开发人员提供了高效、快速的开发模式,并且其中一些深度学习框架还提供了多个卷积神经网络模型以便开发人员在较为先进、完善的卷积神经网络模型上进行研究、改进。本文基于Caffe深度学习框架的卷积神经网络进行了以下几项工作和研究:首先,介绍了关于深度学习在图像识别,语音识别,自然语言处理三个领域的研究现状,以及几个主流的深度学习框架,并且进行了比较,由此引出Caffe深度学习框架。之后,从人工神经网络引出卷积神经网络,对卷积神经网络的构成要素和结构进行了详细阐述,对Caffe深度学习框架的几个特性做了介绍,详细说明了Caffe环境搭建的步骤。最后,本文使用Caffe深度学习框架进行仿真实验。仿真包括三个部分:1、以CIFAR-10的神经网络为例,对Caffe框架给出的卷积神经网络示例的配置训练方法进行了说明;2、以自己构建的小型数据集为例,介绍了使用自己创建的数据集和自己搭建的卷积神经网络的训练方法;3、本文对Caffe框架下的基于MNIST手写字符集的LeNet-5网络的改进,本文对激活函数进行了改进,用ReLU函数替代了原始的Sigmoid,并在Le Net-5中加入了一层激活函数,通过对比,本文的方法使得网络的收敛速度有所提高,并且提高了网络训练的正确率。