【摘 要】
:
在深度学习中,GPU通常用于加速深度神经网络的训练过程,然而GPU有限的物理内存意味着它很难训练大规模的深度神经网络模型。现有的内存优化方法包括重新计算方法和CPU-GPU迁移方法,它们对神经网络中的所有层应用单一的优化方式,不能实现理想的训练性能,忽视了神经网络中不同层的数据迁移成本和计算成本不一致的重要特征。针对现有优化方法的不足,提出一种基于层的内存复用和优化方法——Layup,包含两个策略
论文部分内容阅读
在深度学习中,GPU通常用于加速深度神经网络的训练过程,然而GPU有限的物理内存意味着它很难训练大规模的深度神经网络模型。现有的内存优化方法包括重新计算方法和CPU-GPU迁移方法,它们对神经网络中的所有层应用单一的优化方式,不能实现理想的训练性能,忽视了神经网络中不同层的数据迁移成本和计算成本不一致的重要特征。针对现有优化方法的不足,提出一种基于层的内存复用和优化方法——Layup,包含两个策略:第一,结合GPU异步执行的特性,通过分析神经网络中不同层的迁移开销和重新计算开销,将神经网络中的层划分为计算敏感型和迁移敏感型两类,不同类型的层使用不同的优化策略。使用CPU-GPU迁移方法优化计算敏感型层的特征图,使用重新计算方法优化迁移敏感型层的特征图,同时使用流水线并行的方式将数据传输过程与计算过程重叠起来,进一步降低神经网络模型整体的训练性能开销。第二,通过分析神经网络训练过程中的内存使用情况,提出多种中间数据的内存复用策略。使用滑动窗口的方式复用梯度图的内存空间,并基于神经网络逐层计算的特性,逐层复用卷积工作空间和cuDNN句柄数据,进一步降低深度神经网络训练时的内存使用量。上述方法实现在Caffe系统上,并在两种不同规格的GPU上进行测试。实验表明,Layup方法可以显著降低深度神经网络训练时的内存消耗,同时保持较低的性能开销。训练时的内存消耗最高减少92%左右,同时,在所测试的神经网络模型上的性能开销平均仅为12%。特别的,在内存容量为12 GB的GPU上可以训练高达2500层的ResNet模型(批量大小为16),与SuperNeurons方法相比提升约30%,进一步扩展了单个GPU上神经网络模型的规模。
其他文献
近年来,随着人们物质生活水平的提高,人们对于自身健康管理的需求越来越大。心血管疾病,呼吸系统疾病,恶性肿瘤,糖尿病等慢性疾病已经成为导致我国居民死亡的主要原因。其中,
在电力系统中,合理地配置无功补偿装置,对电力系统的安全稳定和经济运行至关重要。为防止架空线路遭受破坏等引起事故以及满足城市建设的需求,进一步美化城市环境、优化城市
自然场景文本中包含各种隐私信息,例如家庭住址、电话号码等。隐藏自然场景图像中的重要文本信息,将可以有效地防止我们处于隐私泄露的高风险之中。因此,场景文本擦除成为了
随着互联网的发展,人们能够获取的信息资源愈加丰富,这些信息资源在方便人们生活的同时也引发了一定的问题。人们通常需要消耗大量的精力与时间来从庞大的信息库中找到自己想
目标跟踪技术作为计算机视觉领域的一项重要分支,是人与计算机之间互相传递信息的重要手段之一,其对人工智能的发展至关重要。目标跟踪技术应用广泛,场景复杂多样、目标运动
随着现代科学技术的飞速发展,国际间的电子商务的活动也日益频繁,业务整合是发展的关键,而翻译成为商务交流中不可或缺的一环。此类文件的主要职能是传达思想。这一文本的语
目的:高血压是临床上最常见的心血管疾病之一,因此越来越多的手术患者并存有高血压。即使患者术前血压控制良好,但是由于患者对手术的恐惧、入室后的精神高度紧张因素造成的血流动力学波动,导致心脑血管意外也有发生,因此麻醉医生保证患者血流动力学的稳定十分重要。右美托咪定(DEX)属于新型的麻醉辅助用药,由于独特的药理体特性已经被广泛应用到高血压患者的临床麻醉中,但是现在的许多国内外研究对术前预给DEX对高血
随着全球能源和环境问题日益严重,煤、石油、天然气等化石燃料逐渐消耗,对于新能源的开发利用已经成为急需展开研究的方向。生物质能具有资源丰富、分布广泛、低碳、清洁可再生、利用技术多样的特点,因此受到了研究者们的广泛关注。本文主要依托国家科技支撑计划——生物燃气产业模式研究与利用示范(2015BAD21B05)。以农林生物质等难降解的生物质废弃物为对象,针对目前农林生物质气化中燃气热值低、燃气含有较高杂
随着我国经济的高速发展,能源的消耗量日益增加,在不久的将来,最紧迫的问题之一是跟上不断增长的能源需求,同时避免过度的环境退化。将太阳能与生物质资源进行耦合利用以取代传统化石能源,可缓解我国能源结构不合理、能耗高、污染重等问题。但目前对于这一过程的具体反应机理及诸如熔融盐等添加剂对与热解反应途径的影响仍有待进一步探究。本文针对500-700℃下LiNaK的三元共晶碳酸盐对生物质热解反应途径和动力学机
随着国民经济的发展及环境恶化,开发新型能源已经成为迫切需求。太阳能作为一种新型能源,具有资源丰富、无污染等优点。在我国北方采暖地区,城市主要采用集中采暖方式,而农村地区绝大多数是采用以煤、天然气等燃料的分散自供暖方式,在污染空气的同时经济性也较差。采用太阳能集热器将太阳能转化为热能作为建筑采暖热源的方式既环保又经济。本文对太阳能微小通道集热器的性能进行了研究与优化。首先建立了该装置的数学和物理模型