论文部分内容阅读
步入5G时代,云计算模式难以应对网络边缘产生的大量数据以及越来越多的延迟敏感应用,边缘计算被提出来应对这些挑战。为了充分利用网络边缘产生的大量数据,机器学习等方法通常被采用,其中深度学习在以图形处理为代表的诸多应用场景取得了良好的效果。在“边缘智能”这一概念的推动下,将边缘计算技术和深度学习等技术结合同时基于边缘数据的地理分布式特点进行边缘分布式模型训练成为了一个热门的技术趋势。在网络边缘进行分布式模型训练首先需要在边缘节点上部署相应的模型训练服务。已有的服务部署研究往往针对轻量的普通服务,主要从服务请求延迟和系统能耗等角度研究服务部署。模型训练服务的任务请求由于其资源的密集性和运行的长期性与普通的边缘服务有较大的差别,需要从新的应用场景研究服务部署问题。本文从时间段的角度考虑模型训练服务的部署,并基于服务部署代价和服务部署收益这两个量化方式,以最大化系统综合收益的目标,研究最优的服务部署决策。服务部署问题首先被形式化为了一个非线性的0-1整数规划问题,然后本文通过优化目标转化、松弛、约束条件延迟判断以及随机舍入等技术,提出了 RDSP模型训练服务部署算法,并通过理论分析证实了 RDSP算法的性能保障。基于多个性能指标的仿真结果显示,相对于基准算法,RDSP算法在维持绝对的负载均衡性能优势的同时可以提升26%的系统综合收益。为了保障系统性能,边缘系统还需要恰当地卸载分布式模型训练任务。一个典型的边缘分布式模型训练任务往往涉及到多个数据节点,卸载任务时需要解决节点的指派问题。在大部分现有的边缘任务卸载相关研究中,一个任务仅涉及一个请求节点,同时在大部分边缘模型训练相关工作中,往往假设数据是在边缘节点准备好的,而忽略了数据节点指派问题。此外,由于边缘节点资源的有限性,需要研究如何在多个边缘节点为多个分布式模型训练任务分配资源从而保证服务质量,这是大部分现有工作没有考虑的。本文联合地考虑模型训练任务的卸载问题和资源分配问题,并从最大化系统训练任务吞吐率的角度出发,将这个联合问题形式化为一个被证明为NP难解的非线性混合整数规划问题。基于约束条件转化和随机舍入等技术,本文设计了 RDJOA算法用于模型训练任务卸载和资源分配,理论分析表明RDJOA算法有着接近理论最优解的性能。仿真结果指出,相对于基准算法,RDJOA算法能提升56%的系统训练任务吞吐量以及53%的平均边缘节点资源利用率。