边缘网络下的分布式模型训练和任务卸载机制研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jiu999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物联网的日益普及正推动着各种应用的发展,如交互式在线游戏、人脸识别、3D建模、VR/AR和车辆网络系统等,这些应用每分每秒都从物理世界产生大量数据。为提高用户服务质量,需要高效利用这些数据进行模型训练或知识推理等任务,实现物联网和人工智能的深度融合。在传统的场景下,大量的数据需要通过核心网络传输到远程的云平台进行训练或处理。然而,目前的核心网络负担沉重,使得云对应用程序请求的响应存在较长延迟,这既影响了模型训练效率,也降低了用户体验,同时也增大了用户的隐私泄露风险。为此,业界和学界提出了一种新的范式——边缘计算。边缘计算的主要理念为利用网络边缘设备的计算能力,将计算、存储等资源从云下沉至边缘,使得数据和任务能够就近在边缘设备上被处理,这样既缓解了核心网络的负载压力,也为用户提供了低延时高安全性的服务。然而,与集中式的数据中心相比,在边缘网络中进行高效的模型训练或知识推理面临一些新的挑战。一,边缘异构,边缘网络中各种不同的设备都可能参与执行训练或推理任务,这些设备具有不同的地理位置、计算能力,网络质量、数据量、数据分布等,因此任务的完成质量(计算延迟、通信延迟、能耗、模型精度等)可能会有很大的差异。二,资源有限,边缘节点的计算能力通常是有限的,因此计算密集型任务(如模型训练)可能会造成较高计算延迟,而在边缘网络中的通信资源通常也是有限的,因此数据密集型任务(如VR/AR)的传输可能会造成较高延迟。三,健壮需求,边缘网络包含大量的边缘节点,如何设计有效的机制调度这些节点协作执行模型训练或知识推理任务,保证系统的健壮性异常困难。四,环境动态,边缘设备可能处于高速移动且不可预测的状态,边缘网络的数据流量也处于动态变化之中。本文为应对以上边缘网络的挑战,从更新机制和体系架构两方面对模型训练进行了研究,分别提出了半异步联邦学习机制和统一的分层联邦学习聚类机制。训练好的模型被部署到边缘节点上之后,用户的知识推理任务需要被卸载到边缘节点执行,本论文为此设计了任务卸载的分布式决策机制。主要研究工作如下:(1)在模型训练的更新机制方面,提出了半异步联邦学习机制(FedSA),实现了边缘网络下高效的分布式模型训练。具体来说,在每一轮模型训练中,中央参数服务器根据边缘节点的模型到达参数服务器的顺序,对接收到的前M个本地模型进行聚合。此外,本文证明了 FedSA的收敛性,同时分析了 FedSA的收敛界与参与全局更新的边缘节点数量M、数据分布、边缘异构性和通信预算等因素之间的定量关系。在此基础上,提出了一种有效的算法根据边缘的异构性和边缘节点上的数据分布确定M的最优值,从而在给定通信预算的情况下最小化训练时间。此外,本文根据边缘节点参与全局更新的相对频率自适应设置学习率,进一步提高了在非独立同分布数据下的模型精度。在实验平台上实现了提出的机制和算法,实验结果表明,在具有不同程度非独立同分布程度的数据集上,所提出的机制都比现有机制性能更好。(2)在模型训练的体系架构方面,提出了统一的分层联邦学习聚类机制(Fe-dUC)以加速分布式模型训练。本文探讨了分层联邦学习中的三种不同簇间聚合模式(CenSyn、CenAsy和DecSyn)的收敛界与多个因素之间的定量关系,如簇间的数据分布、每个簇参与簇间聚合的频率和簇间拓扑结构等。对簇内聚合,本文提出了一种基于“魔镜法”的分时调度策略(Magic Mirror Method Based Time-sharing Scheduling Strategy,TS-3M),并证明了 TS-3M能够最小化簇内聚合的完成时间。在簇间聚合模式收敛性分析和最优簇内聚合调度策略的基础上,本文设计了一种统一的聚类算法FedUC以解决分层联邦学习的簇构造问题。在分层联邦学习的不同簇间聚合模式下,FedUC都能提供最优的聚类方案。实验结果表明,通过部署聚类算法FedUC,可以大大加快CenSyn(2.67×),CenAsy(3.03×)和DecSyn(8.32×)模式下的模型训练速度。(3)在知识推理任务的卸载方面,提出了任务卸载分布式决策机制(DTO),实现了边缘网络中高效的分布式知识推理。在DTO中,每个用户仅根据本地信息(如当前的传输信道、相邻边缘服务器的资源使用情况)独立做出自身的任务卸载策略。由于决策算法执行时间很短,且不会随着边缘计算网络规模的增加而增加,因此DTO具有高可拓展性,并应用于高动态的边缘场景。针对用户端设计实现了两种任务卸载算法,一种是基于贪心策略的算法DTO-UG,仅包含简单的线性计算,决策速度更快;另一种是基于凸优化的算法DTO-UX,具有更优秀的决策质量。本文从理论上证明了所提出的算法收敛于全局最优解。本文搭建了一个实验平台,用户端动态生成对延迟敏感的推理任务(车牌检测),测试提出的卸载算法的有效性。本文还进行了大规模的数值模拟。数值仿真和系统平台上的实验结果表明,与现有算法相比,DTO在保持较短的决策时间的同时,能够将推理任务的平均响应时间降低50%-65%。
其他文献
思想政治教育的生成逻辑包含着“生”与“成”两个维度,它反映着思想政治教育产生、发展的内在根据,揭示其由“生”到“成”过程中合规律性与合目的性相统一的内在尺度。作为学科的元问题,思想政治教育的生成逻辑寄托着对思想政治教育何以“是其所是”的本体论追问,是关涉学科自身存在的根源、价值与意义的重要问题;同时,作为蕴含着马克思主义实践观点思维方式的“生成论”问题,思想政治教育的生成逻辑研究通过对思想政治教育
学位
随机数是满足一定的统计性质且不存在周期性或明显规律的非确定性序列。它的应用无处不在,比如在生活娱乐、博彩、科研模拟、国防军事、密码学等领域都需要使用随机数。基于不同的产生原理,随机数的产生方式也不尽相同。目前广泛使用的方式可分为基于计算机算法产生的和基于物理过程产生的。通常来说,前者的随机数产生速率较高,能够满足社会生活中大多数应用的需求。然而,它的输出序列的随机性完全依赖于输入的“种子”,具有一
学位
大气污染一直是中国严重的环境问题,影响着空气质量、气候变化和人类健康。人类一生大部分时间都在室内度过,又由于室内污染源的存在以及室内相对较低的空气交换水平,室内颗粒物的来源往往较室外更为广泛,浓度水平更高,成分和毒性更复杂,对人体健康的危害更大,需要更多的关注和研究。因此本研究以室内颗粒物为主要研究对象,系统研究室内颗粒物的理化性质及风险特征,解析室内颗粒物来源,为制定有效的防治措施提供理论依据。
学位
针对现有钻孔剪切仪存在的缺点,对既有土体钻孔剪切仪进行自动化改造。为评估改造后的钻孔剪切仪测定土体抗剪强度的适用性,以光谷创新基地黏性土及广佛环线琶洲站残积土(原状、短时(2~3h)浸水试验及24h浸水试验)为研究对象,利用改造后的钻孔剪切仪进行了大量钻孔剪切试验,得到了原状黏性土和残积土(原状、短时(2~3h)浸水及24h浸水)的抗剪强度参数。从多方面对钻孔剪切试验与直剪试验结果差异性进行了分析
期刊
慢性肾炎起病隐匿,早期症状并不明显,有些患者一发现就已表现为严重肾功能损害,部分患者还会发展为尿毒症。一般来说,从慢性肾炎发展到尿毒症往往需要很长时间,患者只要及时干预治疗,不拖延病情,就能避免尿毒症的形成。
期刊
为积极落实“碳达峰碳中和”战略,在隧道建设中,优化炮孔装药结构是钻爆法隧道实现绿色降碳的有效途径。通过现场试验和数值模拟对比研究水封爆破相对于常规爆破的降碳效果,并在工程实践中量化分析二者在碳排放评价上的优劣。首先,分析隧道爆破施工全过程的3个主要碳排放源,包括乳化炸药用量、风钻钻孔与炸药运输消耗的油品和通风降尘消耗的电力,并建立基于生产过程的隧道爆破碳排放计算模型。其次,通过有限元软件LS-DY
期刊
分数阶微积分是一种处理任意实数阶或复数阶导数和积分的数学理论。在过去的几十年中,分数阶微积分的概念在工程和科学的许多领域得到了不断的实践和验证。在控制科学与工程领域,非整数阶或分数阶的动态系统和控制越来越受到人们的关注。研究表明,分数阶系统模型比整数阶系统模型更精确、更紧凑,并且分数阶的控制方法比整数阶的控制方法更灵活、更有效。近年来,分数阶控制器的设计问题已经成为控制系统领域的研究热点。分数阶P
学位
为探究高速铁路大跨度斜拉桥钢箱梁温度场的时间和空间分布规律,基于商合杭高铁裕溪河大桥长期现场实测温度数据,通过时间序列分析、傅立叶曲线拟合等方法,针对高速铁路斜拉桥钢箱梁的温度荷载模式开展研究。通过时间序列加法模型,将钢箱梁的温度时程分解为长期趋势、年温度作用、不规则变动和日照作用,并拆分钢箱梁温度为日均匀温度和波动温度,分别得到二者的时程曲线。此外,通过傅立叶曲线拟合获得钢箱梁的日均匀温度和四季
期刊
青藏高原上对流层—下平流层(Upper Troposphere-Lower Stratosphere,UTLS)中的大气湍流是地—气系统中非常重要的物理过程,对东亚季风环流的形成和全球大气环流的变化有着重要影响。本文主要利用2012年~2016年高垂直分辨率探空数据研究了青藏高原对流层顶及UTLS间大气湍流的结构特征、影响因素及机制分析,主要结果如下:(1)通过改进最冷点对流层顶(Cold Poi
学位
无机纳米材料诸如稀土、过渡金属材料具有独特的光、电、磁等性能,在医学材料领域具有广泛的应用价值。特别地,利用化学合成技术对无机纳米材料进行修饰组装,为相关医用材料的功能拓展及临床应用提供了新契机。但是,如何构建、选择适配体并利用共价/非共价键驱动修饰组装以实现无机纳米材料功能的优化及拓展仍然是目前需要解决的一大难题。此外,传统的无机纳米材料在未添加溶剂体系中呈无序排列引导的粉末状态,高温等苛刻条件
学位