论文部分内容阅读
随着分布式计算、Web访问、搜索和数据备份等应用的迅猛发展,在数据中心和计算系统内,多种应用往往并发运行,其网络需求在时间和空间上呈现一定的关联和交叠,因而具有混杂性,这就对网络资源的合理调度提出了越发严峻的挑战。另一方面,以光交换技术为核心的光互联网络,因其高带宽、低时延、拓扑灵活、网络资源维度丰富和支持多粒度交换等优势,近年来,成为解决数据中心和计算系统等内部小尺度空间互联需求极具竞争力的技术方案。充分发挥光互联网络天然优势,提高其对混杂应用的支撑性能,被认为是未来光互联网络智能演进的重要方向。本文正是针对混杂应用需求对光互联网络资源调度带来的机遇和挑战,研究光互联网络中不同角度,不同层次的资源调度算法。具体地,论文主要工作可以归纳如下:第一,面向应用中关联性的流量特征,研究光互联网络拓扑感知的流量工程。具体通过虚拟机和应用任务合理放置的设计实现,重整网络节点间的流量分布,保证应用流量特征在映射到光互联网络拓扑时不被破坏,且能够发挥光互联网络高联通度拓扑对应用流量适配的优势。通过仿真对算法下的通信成本和应用流量传输完成时间进行评估,结果证明所提流量工程算法能够有效降低应用流通信成本,维持应用流的关联性;且相较于应用流优化策略,能够进一步加速应用流完成时间。第二,为降低系统复杂性,减少应用开发成本,增加网络自主智能,研究无先验知识场景下的光互联网络调度方案。具体提出了一套基于机器学习的无先验知识应用需求感知算法,以及其辅助的智能资源调度系统。这些算法包括基于决策树实现不同应用的数据流分类;基于卷积神经网络和谱聚类的模式识别算法实现2D层面流量特征的识别;基于长短期记忆循环神经网络实现流量预测。进一步地,将这些算法与调度策略相结合,设计和实现智能光网络资源调度系统IORSS,并验证了需求感知算法和资源调度算法组合的性能,证明应用需求感知的网络资源调度算法较无感知的调度策略,对应用性能具有显著提升。最后利用无先验知识的应用感知,设计并实现了面向分布式计算应用的故障定位和快速恢复。第三,研究面向混杂业务需求,光互联网络多维资源的联合调度方法,首先讨论了光互联网络联合调度模型,其次基于该模型,提出了基于深度强化学习的光互联网络资源联合调度方法,通过大规模仿真评估了该算法在提高应用流完成时间和网络带宽利用率上的性能。随后,提出了面向多维资源优化的传输控制层协议改进,通过实验证明了改进机制的有效性。最后,提出了面向泛化计算场景的融合资源调度方案,并进行了概念实验验证,对未来智能自塑光互联网络进行了展望。