基于硬件分区策略的深度学习预测服务系统性能优化研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hustyhw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是机器学习的一个新的研究方向,机器学习是为了使机器或者算法通过对大量数据的学习使其达到人工智能的水平,深度学习正朝这个方向发展。现阶段深度学习是解决机器学习中一些难题的常见做法,并且取得广泛的成功,从目标监测、语音识别、智能问答、推荐系统到自动驾驶,取得远超传统短算法的效果。而这些深度学习的预测服务都是在线推理预测,因为应用层使用深度学习模型做推理预测难以满足时延要求,将深度学习模型部署在的预测服务系统之中,满足应用层对预测用时的基本要求。随着深度学习应用在越来越多的领域,对预测服务系统的研究也受到更多的关注。深度学习预测预测服务系统是一个与深度学习模型耦合的预测服务系统,应用在模型的部署与推理预测阶段,预测服务系统将深度学习模型的推理预测部署为在线推理预测功能,深度学习模型为在线预测请求提供实际的推理预测运算。本文的研究内容为深度学习预测服务系统的性能优化策略,包括预测服务的耗时方面和预测的准确率,介绍了可行的优化策略,并针对性地提出了减小平均预测用时的优化策略,硬件的分区使用。预测服务系统中,模型每进行一次推理预测计算,需要占用大量硬件资源,如CPU核心、高速缓存、内存带宽等。预测服务系统通常需要部署多个深度学习模型,提供多种预测服务,这些预测服务需要响应对应的SLO(Service Level Objective)时间。而预测服务系统中所有模型都是以相同的优先级占用硬件资源,并没有通过对预测请求的SLO用时限制。当不同SLO时间限制的模型同时运行在同一硬件环境下,对硬件资源的竞争就会出现,而竞争的结果是随机的,因此就需要先保证SLO时间较小的模型对硬件资源的优先使用,依次使各个预测请求尽可能满足SLO时间限制,降低预测平均用时。提出的硬件分区策略,结合资源调配技术将硬件划分为不同的逻辑资源池,每个模型能独占式地使用资源池地资源,以减少模型运行时相互之间的影响,达到了减少推理预测平均用时的效果。并提出资源池动态适应的算法,对某一个模型,根据预测任务用时与预先设置SLO时间的差值变化,动态反馈调节对应模型所占用的硬件资源池,减小预测请求的用时并提升硬件资源的利用率。
其他文献
近几十年来,随着中国经济的发展,人们对交通运输的需求与日俱增,不断增加的交通运输负载对现有桥梁结构的安全性能造成了挑战。与此同时,大多数现役中小型桥梁结构没有条件安装昂贵的桥梁健康监测设施,建立一种可靠、高效且经济的方式对此类桥梁结构进行快速检测评估十分必要。桥梁影响线作为反映桥梁结构性能的重要指标,在桥梁性能评估、桥梁损伤识别、桥梁动态称重等方面有着广泛的应用。对于缺乏桥梁动态称重系统支持的中小
网络入侵检测系统能够发现可疑的网络攻击,并采取一系列保护网络安全的措施来减少用户的损失。网络流量分类则是网络入侵检测任务中的重点,它可以判断所收集的网络流量数据,并检测出具有攻击行为的流量。因此,网络流量分类和入侵检测对于保护网络安全至关重要。机器学习和深度学习方法的出现和发展,使得网络流量分类和入侵检测的效果也得到了一定的提升。但是,目前基于机器学习或深度学习的流量分类检测方法,依然存在诸如流量
织物增强混凝土(Textile Reinforced Concrete,TRC)在过去二十年中获得了广泛的研究。TRC具有高强度,高韧性等优点,可以显著改善水泥基材料低抗拉强度的力学性能。若水泥浆体不能充分浸入纤维束内部,会造成纤维束受力不均匀,外层纤维受力较大而先发生破坏,从而阻碍了纤维强度的充分利用,为提高TRC的整体性能,通常需要对纤维进行处理。因此本文以探究不同纤维处理方式对TRC力学性能
地铁由于高速、快捷且不占地面空间,近二十来年来在我国各大城市得到前所未有的超速发展,导致对地铁基础配套设施的需求增长迅速。地铁屏蔽门系统为各地铁站基础配套设施,其立柱类结构件为屏蔽门系统的骨架和核心部件,其焊接质量直接影响屏蔽门系统的功能,进而影响地铁的安全、舒适、节能运行。基于地铁屏蔽门立柱结构件需求量剧增而当前普遍采用手工焊接存在的焊接效率低下、质量一致性差、受工人技术水平、工作状态和经验影响
锂硫电池由于其超高的理论能量密度(2600 Wh kg-1)和正极硫的廉价性而被认为是下一代储能新技术的有力竞争者。然而硫自身的性质及其电化学行为引起了许多不利因素,尤其是多硫化物的穿梭效应,严重阻碍了锂硫电池的实用化进程。近年来出现了采用电催化剂加速多硫化物转化的新策略,该策略可有效降低穿梭效应影响。在众多催化材料中,过渡金属催化剂由于其较大的比表面积和高活性的催化位点而备受关注,例如Fe、Co
对氨基苯胂酸(Arsanilic acid,ASA)作为一种有机砷饲料添加剂,广泛用于牲畜和家禽生产,以预防疾病和促进增长。被动物摄入的ASA有超过90%不会被同化吸收而是原原本本地随尿液和粪便被排泄出来。通常,这些排泄物作为肥料被运往农田。由于ASA的高水溶性,它很容易被雨水或灌溉用水淋溶进入水环境中,造成附近的水体中总砷含量的升高。在自然界中,ASA可以轻易地通过厌氧生物降解或自然光降解等方式
随着人们生活水平的提高和经济的飞快发展,人们对清洁水的需求不断提高。淡水资源短缺和水污染是21世纪人类面临的两个最重要的环境问题,这就要求人们继续寻找对环境友好、成本效益高的海水淡化技术。流动电极电容去离子化(FCDI)因其卓越的海水淡化能力和可以持续不间断的运行而受到越来越多的关注。研究人员对于干扰FCDI脱盐性能的重要要素,包括电极材料、电解质溶液等一直有所研究,也不断对FCDI装置的设计进行
稀疏矩阵向量乘法是数值计算的核心子程序之一。在实际应用中使用迭代法求解大规模稀疏线性方程组来逼近其精确解,Sp MV作为迭代求解的主要计算步骤通常需要执行数千次。然而,相关处理器硬件的复杂加上稀疏矩阵的稀疏特征导致了计算的负载不均衡并形成了内存瓶颈,这使得优化Sp MV的性能十分困难。ARMv8-A是ARM推出的一款高性能计算处理器架构,首次支持开始支持64位的指令集,提高了双精度浮点运算能力,并
聚丙烯因其优良的综合性能,被广泛应用在机械、汽车、电器、建筑、纺织、包装、化工、医疗器械等领域。但是由于其分子链中基团极性弱而导致其亲水性较差,极大地限制了聚丙烯产品的应用范围。为了克服其亲水性较差的缺点,本文以等离子体表面处理为基础,分别采用等离子体改性聚丙烯表面亲水性、等离子体诱导接枝二乙烯三胺,采用FTIR、AFM和接触角测试研究了改性过程中薄膜表面官能团、微观形貌、粗糙度和接触角的变化,研
90°弯折钢筋(以下均简称弯折钢筋)是一种常用的机械锚固方式,被广泛运用于钢筋混凝土框架梁柱边节点之中,以解决柱截面高度不足以提供足够的直钢筋锚固长度使钢筋达到其设计强度的锚固长度设计问题。为研究弯折钢筋各部分锚固承载力的大小及占比,通过在弯折钢筋各锚固段放置PVC套管的方式来消除钢筋与混凝土之间的黏结作用,并通过相互对比试验达到分离锚固承载力的目的。试验采用HRB500级钢筋作为锚固钢筋,以其水