【摘 要】
:
作为下一代云计算范式,无服务器计算将云资源抽象为函数(functions),由云服务商负责配置、管理、部署、缩放用户应用所需的函数资源,并提供百毫秒级别的计费粒度;而用户则专注于程序编写,仅需为程序实际运行占用的时间及资源付费。基于上述高效率、低成本等优势,利用无服务器计算进行分布式深度神经网络(Distributed Deep Neural Network,DDNN)训练正成为一大趋势,用户无需
论文部分内容阅读
作为下一代云计算范式,无服务器计算将云资源抽象为函数(functions),由云服务商负责配置、管理、部署、缩放用户应用所需的函数资源,并提供百毫秒级别的计费粒度;而用户则专注于程序编写,仅需为程序实际运行占用的时间及资源付费。基于上述高效率、低成本等优势,利用无服务器计算进行分布式深度神经网络(Distributed Deep Neural Network,DDNN)训练正成为一大趋势,用户无需配置和管理集群资源,可将复杂的模型训练作业拆分为多个函数来协同完成。尽管无服务器计算平台可为用户提供一种简单的资源接口(即函数数量与函数内存大小),但如何为DDNN训练负载配置函数资源仍是一大挑战。其原因在于:不合理的函数资源配置(如资源分配不足或分配过度)极易导致不可预测的DDNN训练性能。通过部署在AWS Lambda下DDNN训练负载的动机实验结果分析,可推断得出在无服务器计算平台下DDNN训练性能不可预测性的两大形成原因:第一、参数服务器(Parameter Server,PS)的网络I/O带宽极易成为资源瓶颈;第二、在进行DDNN训练时,设置较小的局部批次大小(local batch size)会使得函数资源利用率低下。为此,本文设计并实现一种经济高效的函数资源配置框架λDNN,在无服务器计算平台中为DDNN训练负载提供可预测的运行性能,同时节约用户成本花销。具体而言,首先利用PS的网络可用带宽和局部批次对函数CPU利用率的影响,构建起一个轻量级的DDNN训练性能预测模型;在此基础上,通过函数配置内存和函数数量的上下界分析,为DDNN训练负载设计出一种无服务器计算资源配置策略,从而在保证DDNN负载的训练性能的同时,优化函数资源配置、降低训练成本花销。基于AWS Lambda的大量原型系统实验和基于Microsoft Azure trace的仿真实验表明,与最新的无服务器计算资源配置相关工作相比,λDNN可节约高达66.7%的函数资源使用成本,并具有较小的运行时开销。
其他文献
永磁同步电机因其具有功率密度大、效率高、过载能力强等优点在电动汽车上应用广泛。同时,由于永磁同步电机体积小、转速高、安装空间密闭,在恶劣工况下或长时间运行时极易造成温升过高,从而导致电机绝缘材料失效、永磁体退磁、结构变形等,严重影响电机的工作效率、使用寿命和运行安全性。为了使电机能够长时间、高效率、稳定可靠地工作,通过电机冷却系统的合理设计,将电机温度维持在正常允许范围内十分必要。本文针对某车用永
在我国,山地面积占到国土面积的一半以上,尤其在重庆和四川等地区。为了更有效的利用土地资源,山地建筑日益增多,其中掉层结构占有很大的比例,山地掉层框架结构由于不等高接地方式的特点,使其受力性能与普通框架结构有显著差异。中国是一个地震频发的国家,许多地震带和地震断层就分布在我国各个省、区、市,而且有不少大中型城市就坐落在断裂带附近,因此近场地震动的特性受到越来越多的学者关注。这种地震动由于包含脉冲信号
我国柑橘栽培品种多为中熟品种,上市集中。培育不同熟期的新品种,才能满足大众的消费需求。本试验是以雷波脐橙(对照)及其早熟单株的果实为材料,从叶绿素降解代谢入手,通过比较其果皮叶绿素含量的差异、代谢产物差异、关键酶活性及关键基因表达差异,探讨了果实自然脱绿转色过程中叶绿素的变化特点,为柑橘类果实叶绿素降解代谢调控的相关分子机理提供理论依据。研究结果如下:(1)利用RAPD分子标记,对早熟单株和对照的
β-甘露糖苷广泛存在于各种天然产物中,许多具有这类结构的化合物对生物体的正常生命活动起着至关重要的作用。然而,β-吡喃甘露糖苷键的构建在糖科学领域是具有挑战性的难题之一,其主要原因在于:1)、吡喃甘露糖C-2轴向取代基的空间位阻阻碍了受体进攻吡喃环的β面,不利于β-糖苷键的形成;2)、异头碳效应有利于形成热力学稳定的α-吡喃甘露糖苷键,而不利于β-吡喃甘露糖苷键的构建。基于β-甘露糖苷的重要生物活
我国传统的乡村公共空间作为容纳村民日常生活及邻里交往的物质空间,是村民可以自由进入并展开日常社会交往、参与公共事务的主要场所,具有愉悦身心、提供公共服务、促进乡村社区整合等多重功能。近年来,党和政府高度重视乡村建设,提出乡村发展要“让居民望得见山、看得见水、记得住乡愁”,2018年中央一号文件进一步提出“发展乡村共享经济、创意农业、特色文化产业”的新思路。由此,我国部分基础条件较好的乡村公共空间开
本文研究如下分数阶非线性薛定谔方程iψt=(-Δ)sψ+f(|ψ|2)ψ,x∈T=R/Z,(0.1)在Dirichlet边界条件ψ(t,0)=ψ(t,1)=0,且满足ψ(t,-x)=-ψ(t,x)时拟周期解的存在性问题。其中(-Δ)s是Laplacian算子的分数阶,即Laplace-Beltrami算子-Δ的s次幂,s∈S=(21,1)。f是在原点邻域内的解析函数。本文的主要结论是:以s作为参数
基于NiOx空穴传输层的反型钙钛矿太阳能电池(PSCs)具备制备工艺简单、制备所需温度低、成本低等优点。近年来,NiOx基PSCs的功率转换效率(PCE)突飞猛进,达到20%以上。但是,一些典型修饰掺杂材料对PSCs的修饰原理相对简单,限制了NiOx基倒置PSCs的性能提升。此外,PSCs在高湿度、高温和紫外线照射环境下结构不稳定,容易分解。本文以基于Sr@NiOx(即掺入少量Sr离子的NiOx)
供应链,顾名思义,是在生产和销售商品的环节中,供应商、生产商、零售商以及消费者之间形成的链式结构。近年来,随着全球化的兴起,人们对供应链的公平性、隐私性、安全性和效率的要求显著提高。然而,供应链在多个方面仍存在一些问题,比如在信息流中,上游企业和下游企业对商品的需求量与销售量等信息的了解不对称;在商品的流通过程中,消费者买到质量不合格的商品难以追溯其源头企业;以及在资金流中,上游企业和下游企业之间
本文主要研究了圆柱形图,即路和圈的笛卡尔乘积图(Pm×Cn)的最多叶子生成树和最大不可分独立集问题.第一章介绍了最多叶子生成树、最大不可分独立集、最小连通点覆盖问题的研究现状.第二章研究了圆柱形图(Pm×Cn)的最多叶子生成树问题.根据生成树的特点,给出了Pm×Cn(m=2,3)最多叶子生成树的叶子数目.再根据生成树中2-度点和3-度点的数目,得出了Pm×Cn生成树叶子数目的上界.最后通过构造给出
尽管量子色动力学(QCD)被公认为描述强相互作用的基本理论,但夸克禁闭使得人们很难直接使用该理论进行中低能区的解析计算。为此人们发展了数值的格点QCD进行非微扰计算,但目前在数值计算时需采用大于物理值的夸克质量,计算的结果需要进一步外推至物理值区域,因此仍需系统自洽的解析结果进行比对。这就使得QCD的低能有效场论——手征微扰理论,进入舞台,并在对介子系统的研究中取得了极大的成功。但是这个理论在运用