低计算预算下深度学习的有效方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:kikat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是一种人工智能技术,它采用基于人工神经网络的算法构建而成。在过去的十年中,它已成为研究人员和开发人员解决完全自动化任务的绝佳工具,否则这些任务将由人类完成。在过去几年中,深度卷积神经网络(Convolutional Neural Network,CNN)成功地训练了大型分类问题模型,为改善计算机视觉和机器学习应用做出了重大贡献。与传统的网络相比,CNN能够训练大型、复杂的数据集并产生突破性的分类结果,因此在深度学习中越来越受欢迎。毫无疑问,CNN需要高计算和内存成本。这将其实施范围限制在具有强大中央处理单元(Central Processing Unit,CPU)和图形处理单元(Graph Processing Unit,GPU)的设备,对于通常资源有限的移动手持设备或嵌入式设备来说,这可能具有挑战性。与大型并行CPU网络和GPU工作站相比,智能移动嵌入式设备最近激增,通常资源更少,因此迫切需要确保计算机和深度学习模型部署在此类设备上。本文旨在在资源有限的设备上训练和测试CNN,探索任何深度神经网络的确切内存使用要求和计算时间,并确定确保其使用不受影响的最佳方式。尽管许多技术已经提出并实施,但比较不同的技术并找到最简单、最准确的技术是很重要的。在过去几年中,由于GPU系统和内存成本高昂,为深度学习研究做出重大贡献的最有效分类方法(如在Image Net竞赛)中成本高昂。本文侧重于找到有效方法,显著减小我们的训练模型、内存和运行时要求的大小,同时实现真实应用的标准精度指标方面的技术性能。首先,修剪和量化方法对分类任务的模型大小减小的贡献;其次,研究了室外场景和室内场景的语义划分,提出了一种新的深度神经网络架构,以有效理解场景;第三,研究生物医学成像应用中的低成本深度学习方法。主要贡献和创新概述如下:1.提出了截细、稀疏二进制权重网络以减少模型大小加速推理首先,将基于泰勒扩展标准的排名方法应用到每层滤波器修剪,该方法近似于修剪特定网络滤波器的损耗函数变化;然后,使用训练三元量化将修剪模型的全精度(32位)权重减少到三元(2位)值,从而获得修剪的稀疏二进制权重网络。在加州理工学院-256、牛津花102和加州理工学院UCSD Birds 200基准数据集的结果显示,此方法将模型大小至少减少32倍(作为2位权重),但精度降低很少。此外,它还大大减少了所需的浮点操作的估计总数,并且可以在自定义硬件上部署时加速推理。2.提出了SEB-Net以实现精度和计算成本以及实时推理速度之间的平衡该模型由对称结构的编码器路径和解码器路径组成,其中编码器路径由16个卷积层组成,与VGG-19模型相同,解码器路径包括我们所说的E块(高效块),其灵感来自广受欢迎的ENet体系结构的瓶颈模块,稍有修改。此模型的一个优点是,解码器路径中的最大池用于E-Block中的扩展和投影卷积,允许较少可学习的参数和高效的计算(480x320输入每秒10.1帧(fps),参数比Deconv Net少11倍,在TESLA K40 GPU设备上640x360输入的GFLOP为52.4 GFLOP)。在剑桥驱动标签视频(Cam Vid)和城市景观两个室外场景数据集的实验结果表明,SEB-Net可以实现比完全卷积网络、Seg Net、Deep Lab V和Dilation8更高的性能。此外,在联合(i Lo U)的实例级交点方面,SEB-Net分别比ENet和Link Net等高效架构的交互性能提高了16.1和11.6。SEB-Net在室内场景数据集SUNRGB-D上进一步评估时,也表现出更好的性能。4.提出了SD-UNet实现在计算资源有限的设备上分割生物医学数据通过利用整个网络中的深度可分离卷积,本文设计了一个轻量级的深度卷积神经网络架构,其灵感来自于广泛采用的U-Net模型。为了恢复过程中的预期性能下降,本文引入了一种带组规范化方法的权重标准化算法。SD-UNet有3个主要优势:(i)模型尺寸小(比U-Net小23倍);(ii)参数减少8倍;(iii)推理时间更快,计算复杂度低于800万(M)浮点运算(FLOPs))。在ISBI挑战中对电子显微堆栈中神经元结构分割的基准数据集和MSD挑战脑肿瘤分割(BRATs)数据集的实验表明,该模型比目前最先进的模型效果要好。
其他文献
在信息化社会中,教师的专业发展受到了世界各国的普遍关注。2015年,经济合作与发展组织(OECD)公布了世界上第一份针对信息技术教学应用成效所进行的国际比较报告《创造技术与
互联网时代的到来,让世界变的无比精彩,世界格局、经济形态也因互联网发生着变化,而推动这一切发生的创新型公司,思维创新等名词或概念一时间变成国家和企业关注和发展的重点
巡线机器人在巡检过程中,要实现大范围自主行走,需要具有跨越诸如防震锤、悬垂线夹之类障碍物的能力。要跨越障碍物,首先应该检测到它们,进而识别障碍物的种类和对其进行定位
文章就全球工业设备制造企业SXX由品牌投资主导转向品牌长期运营的战略性调整的大背景下,对如何优化全球生产布局和其决策流程进行分析和讨论。寻求在遭受全球经济大环境不利
随着广告业的不断发展,媒介代理公司按需购买的传统业务受到来自上游媒体供应商和下游广告主的双重挤压,为了寻求新的盈利点,媒介代理公司开拓了预购库存的新型业务模式。某
本世纪以来大型跨国公司开始在全球整合资源,特别是通过建立技术战略高地提高核心竞争力和投资回报率,这使得突破性技术创新在企业中的作用凸显。在这种大背景下,汉高公司作
自从三峡大坝建成后,受防洪调度的影响,库区水位周期性消涨,库区环境污染物的迁移转化行为发生了显著的改变。近年来,受到库区航运以及库岸人类活动的频繁影响,库区多地发现
随着我国市场经济体制的进一步形成和完善,加之经济的日益全球化。作为一种新的经营模式,电子商务正在被大众所接纳和推崇,而随着电商行业竞争的加剧,各种整合在所难免。本文
高通量测序技术(又被称为第二代测序技术、大规模平行测序或下一代测序技术)的出现和成熟是二十一世纪生命科学领域最重要的成就之一。凭借其在通量、速度和成本上的巨大优势
刻板印象是指对特定群体的所有成员的概括,包括正面的刻板印象和负面的刻板印象。刻板印象最重要的作用是帮助人们适应陌生的环境,因而对他群刻板印象的研究成为跨文化适应研