深度学习浅谈

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:zhangyili164958807
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:文中对深度学习的发展现状及合作领域进行了阐述,对深度学习的基本模型进行了介绍。主要对卷积神经网络的基本模型进行了介绍,对卷积神经网络模型的基本工作原理进行初步分析,对深度置信网络和循环神经网络进行了基本描述,为后续深度学习及卷积神经网络的深入学习打下基础。
  关键词:深度学习;机器学习;卷积神经网络
  1概述
  深度学习(Deep Learning)是人工智能、图像建模、模式识别、神经网络、最优化理论和信号处理等领域的交叉学科,主要构建和模拟人脑进行分析学习,它属于机器学习的新兴领域。
  2大数据与深度学习
  目前,光学检测、互联网、用户数据、互联网、金融公司等许多领域都出现了海量数据,采用BP算法对于训练神经网络出现了梯度越来越稀疏、收敛到局部最小值只能用有标签的数据来训练等缺点。Hinton于2006年提出了深度学习的概念,Lecun等人提出了卷积神经网络,卷积神经网络利用空间关系减少参数数目以提高训练性能。
  CPU和GPU计算能力大幅提升,为深度学习提供了硬件平台和技术手段,在海量大数据处理技术上解决了早期神经网络训练不足出现的过拟合、泛化能力差等问题。
  大数据和深度学习必将互相支撑,推动科技发展。
  3深度学习模型
  深度学习模型实际上是一个包含多个隐藏层的神经网络,目前主要有卷积神经网络,深深度置信神经网络,循环神经网络。
  1)卷积神经网络
  在机器学习领域,卷积神经网络属于前馈神经网络的一种,神经元不再是全连接的模式,而是应用了局部感受区域的策略。然而传统的神经网络使用神经元间全连接的网络结构来处理图像任务,因此,出现了很多缺陷,导致模型參数急剧增加,及其容易过拟合。
  在卷积神经网络中,网络中的神经元只与前一层的部分神经元连接,利用图像数据的空间结构,邻近像素间具有更强的相关性,单个神经元仅对局部信息进行响应,相邻神经元感受区域存在重叠,因此,综合所有神经元可以得到全局信息的感知。
  另外,一个卷积层中的所有神经元均由同一个卷积核对不同区域数据响应而得到,即共享同一个卷积核,使得卷积层训练参数的数量急剧减少,提高了网络的泛化能力。
  一般在卷积层后面会进行降采样操作,对卷积层提取的特征进行聚合统计。降采样区域一般不存在重叠现象。降采样简化了卷积层的输出信息,进一步减少了训练参数的数量,增强了网络的泛化能力。
  卷积神经网络实现了局部特征的自动提取,使得特征提取与模式分类同步进行,适用于处理高分辨率的图像数据。目前,卷积神经网络在图像分类、自然语言处理等领域得到广泛应用。
  2)深度置信网络
  深度置信网络是一种生成模型,网络中有若干隐藏层,同一隐藏层内的神经元没有连接,隐藏层间的神经元全连接。神经网络经过“反向运行”得到输入数据。
  深度置信网络可以用做生成模型,通过前期的逐层无监督学习,神经网络可以较好的对输入数据进行描述,然后把训练好的神经网络看作深度神经网络,最后得到分类任务的深度神经网络。
  深度置信网络可以用于图像识别、图像生成等领域,深度置信网络可以进行无监督或半监督的学习,利用无标记数据进行预训练,提高神经网络性能。但近几年由于卷积神经网络的飞速发展,深度置信网络已经很少被提及。
  3)循环神经网络
  循环神经网络是一种专门用于处理时序数据的神经网络,它与典型的前馈型神经网络最大区别在于网络中存在环形结构,隐藏层内部的神经元是互相连接的,可以存储网络的内部状态,其中包含序列输入的历史信息,实现了对时序动态行为的描述。这里的时序并非仅仅指代时间概念上的顺序,也可以理解为序列化数据间的相对位置。如语音中的发音顺序,某个英语单词的拼写顺序等。序列化输入的任务都可以用循环神经网络来处理。如语音、视频、文本等。对于序列化数据,每次处理时输入为序列中的一个元素,比如单个字符、单词、音节,期望输出为该输入在序列数据中的后续元素。循环神经网络可以处理任意长度的序列化数据。
  循环神经网络可以用于机器翻译、连写手写字识别、语音识别等。循环神经网络和卷积网络结合,将卷积神经网络用于检测并识别图像中的物体,循环神经网络用于识别出物体的名称为输入,生成合理的语句,从而实现对图像内容的描述。
  4深度学习应用
  1)语音识别
  语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。其应用领域主要有语音输入系统、语音控制系统和智能对话查询系统,语音识别极大地推动了人工智能的快速发展。1952年Davis等人研究了世界上第一个能识别10个英文数字发音的实验系统。大规模的语音识别研究是在20世纪70年代以后,在小词汇量、孤立词的识别方面取得了实质性的进展。2012年,微软研究院使用深度神经网络应用在语音识别上将识别错误率降低了20%,取得了突破性的进展。2015年11月17日,浪潮集团联合全球可编程芯片巨头Altera,以及中国最大的智能语音技术提供商科大讯飞,共同发布了一套DNN语音识别方案。
  2)图像分析
  图像是深度学习最早尝试的应用领域。1989年,LeCun和他的同事们就发表了卷积神经网络的工作。2012年10月,Hinton和他的两个学生用更深的CNN在ImageNet挑战上获得了第一名,使图像识别向前跃进了一大步。
  自2012年以来,深度学习应用于图像识别使得准确率大大上升,避免了消耗人工特征抽取的时间,极大地提升了效率,目前逐渐成为主流的图像识别与检测方法。
  3)自然语言处理
  自然语言处理(NLP)是深度学习的另一个重要的领域。它是计算机科学与语言学的交叉学科,自然语言用电脑处理人类的语言,如英语、汉语、法语等,其主要应用包括机器翻译、信息抽取等。
其他文献
线性代数作为理工类高校所开设的一门重要的公共必修课,该课程具有概念定理多、内容抽象、计算量大且繁琐等特点,学生在平时的学习中不易理解和掌握,解题时只会套用固定模式
近日,河南省济源市人民政府在郑州召开新闻发布会,正式宣布国家质量监督检验检疫总局授予济源冬凌草地理标志保护.保护范围为济源市克井镇、承留镇、五龙口镇、邵原镇、下冶乡、
简要叙述了移动通信的方式和特点,移动通信的设备和应用.着重介绍了第三代移动通信对天线智能化的要求和目前已经开发并用于移动通信系统的几种电控阵列天线.
背景:软骨组织工程是目前的研究热点,它可以克服自体软骨移植损伤与材料来源不足等问题。寻找来源充足且具有强大体外增殖能力和多向分化潜能的干细胞作为软骨种子细胞具有重
目的探讨γ-谷氨酰转肽酶与血压的关系。方法采用横断面研究,收集自然人群样本1480例,采用问卷调查吸烟、饮酒以及服药情况,测量身高、体重、血压等,空腹抽血检测γ-谷氨酰转
淡水养殖水环境因子主要包括水温、溶解氧(DO)、亚硝酸盐、氨氮、硫化氢和pH值等。本文主要阐述了几个主要环境因子对养殖淡水鱼类的影响,以期为养殖生产提供一些技术支持。
2005年6月27日至28日,G华立(000607)控股子公司重庆华立武陵山制药有限公司(下称“华武制药”)接受了世界卫生组织(WHO)的现场检查。近日,WHO发送公函至华武制药,告知其药厂的运行总体
<正>随着互联网与数字化技术的发展与普及,我国高校传统大学外语教学模式发生了重大改革,数字化和互联网技术为外语教学提供了广阔的发展空间,尤其混合式与数字化教学模式运
介绍一种基于VME总线的通用信号处理机的构成及特点,并对其中的一些关键技术进行了介绍.
目的通过比较维吾尔族和汉族女性妊娠早、中、晚期甲状腺激素水平的差异,初步建立新疆喀什地区维吾尔族和汉族女性非妊娠期及妊娠期特异性甲状腺激素正常参考值范围。方法选