基于深度学习的数据中心流类型预测研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:www478478
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测流类型是实现数据中心优化调度流的基础,而现有的预测方法在准确性、控制开销、预测时间、流颗粒度等方面都有提升空间。为此,基于深度学习的多维度特征刻画能力以及软件定义网络(SDN)集中控制的特点,针对数据中心对于流颗粒度、模型大小要求的不同,本文提出如下三种解决方案:(1)针对大象流的预测,提出了边缘预分类+中心精分类两级预测机制,预分类模型使用残差网络算法+具有代价敏感性质的Softmax交叉熵损失函数,精分类模型使用残差网络算法+Additive Margin Softmax交叉熵损失函数。首先,使用随机森林模型筛选出流的时间分布特征、流的实时特征、数据包头部特征3个维度的10个特征。然后,部署在网络边缘的SDN交换机上的预分类模型滤除大部分老鼠流。最后,部署在SDN控制器的精分类模型精准地识别出大象流。基于公开数据集的实验显示,在前五个包进行预测时,召回率可以达到91%,准确率达到93%,控制开销为0.1kbps,预测时间为7ms。所提机制与Flow Seer、ESCA、NELLY等现有主流机制相比,各性能指标均有改善,马修斯相关系数是NELLY的2.52倍,预测时间减少到Flow Seer的0.35%,控制开销降低到ESCA的0.046%。(2)针对多流类型的预测,提出了另一种两级预测机制,第一级模型使用单向单层GRU(Gate Recurrent Unit)算法+具有代价敏感性质的Softmax交叉熵损失函数;第二级模型使用双层GRU算法+Softmax交叉熵损失函数,其中,第一层使用双向,第二层使用单向。首先,通过分析流量在流大小和流持续时间的分布确定分类的阈值。然后,使用方差选择法以及随机森林模型筛选出10个特征。部署在网络边缘的SDN交换机上的第一级模型滤除两种持续时间较短的流;部署在SDN控制器的第二级模型对剩余的流进行更进一步的识别。基于公开数据集的实验显示,在前五个包进行预测时,准确率达到86%,Kappa达到0.79。(3)为了降低预测模型的复杂度,提出了一种基于知识蒸馏(Knowledge Distillation)的模型压缩方法。首先,设计一个老师模型和一个学生模型。然后,利用已经训练好的老师模型以及训练数据的真实标签指导学生模型的训练。基于公开数据集的实验显示,学生模型的大小可降低到老师模型的约20%,在老师模型的准确率、召回率分别达到92.18%、91.31%的情况下,学生模型的准确率、召回率分别也可达到89.81%、88.71%。
其他文献
目标跟踪是计算机视觉领域中的一个研究热点,在实际生活中有着广泛的应用前景。在目标跟踪领域中相关滤波是当前主流的研究框架之一,在该框架下,许多学者提出了很多优秀的跟踪算法,解决了目标跟踪的基本问题,同时也具备较好的精确性。但是在实际应用中,仍会面临很多挑战,比如光照变化、目标遮挡、尺度变化等。针对这些挑战,本文主要在前人工作之上,从特征提取和模板更新这两个模块入手对跟踪器进行改进。论文主要工作如下:
自2013年《塔林网络战国际法手册》(即《塔林手册1.0版》)问世以来,围绕着该手册关于规范网络战争的规则引发了学界争论。对于第一版手册中存在的争议性问题,2017年国际专家组再次进行了修订,即《网络行动国际法塔林手册2.0版》。在这一书中,首先明确了国家主权适用于网络空间,其次对于网络行动规则进行了重新论述。但国家在网络空间中的自卫权行使仍然具有相当大的争议,本文在结合《塔林手册2.0版》中最新
学位
根据中国残疾人联合会2010年末公布的统计数据显示我国残疾人总人数8502万,其中下肢截肢的残疾人数是120多万。患者在截肢后为了能够站立起来进行正常的生活,一般会选择安装
紫外光电探测器广泛应用在民用和军事领域,包括环境监测、化学和生物分析、火焰探测、远程控制和安全的空对空通信。由于出色的化学,物理和光学特性,一维二氧化钛纳米结构(纳
传统相干光接收机可支持高阶调制格式解调和链路损伤补偿,在高速率、长距离光通信中得到广泛应用。新近出现的Kramers-Kronig(KK)光接收机通过数字信号处理(DSP)技术结合单个光探测器即可实现信号光场重建,具有成本低、功耗小的优点,是目前的研究热点之一。本论文围绕KK光接收机实时DSP系统的设计与实现开展了相关工作,主要内容包括:(1)研究了KK光接收机的系统结构和工作原理,设计了相应的D
艾里光束因其无衍射性和自弯曲性,在粒子捕获,显微镜成像,等离子体,大气湍流等领域有广泛的应用,近年来引起了很多研究人员的关注,并取得了一系列研究成果。但有关粒子对一维
高效用项集挖掘是通过效用值来衡量项集的重要性、反应用户的兴趣度,能较好的解决用户的问题,是数据挖掘研究领域的一个热门话题。高效用项集挖掘算法研究相对比较成熟,其效
伴随着图处理的快速发展,包括数据规模、数据类型,以及图应用在内的多方面因素,显著影响着访存特征。图处理的过程一般分为多次迭代进行,每一次迭代过程中同时存在着活跃数据和不活跃数据,而当前图处理主要的研究方向是通过努力获取访问数据的局部性,减少随机访问请求以提高I/O速度,这主要是针对活跃数据的优化工作,但是处理过程中暂不参与处理的数据,也会给存储系统造成负担,其同样受图处理访存高随机性的影响,很难在
作为人工智能领域的佼佼者,深度学习技术在近十年来取得了长足的进步,在诸如计算机视觉、自然语言处理等多个领域成为了难以替代的主流算法。而随着卷积神经网络模型结构的日
随着科学技术的高速发展,数字科技的推陈出新,以及参观者对博物馆职能需求的变化,使世界各地博物馆也面临了新的转型。目前国内博物馆聚焦的重点依旧是参观者,而忽视了展品在展览活动中的重要作用。展品是博物馆展示的主体,是博物馆与参观者情感传达的媒介。针对展品在博物馆传播中的特殊位置,笔者对展品进行了系统的阐释及其设计路径的转化分析,并对其设计路径转化过程中出现的摩擦进行了较深入的研究。本论文主要从博物馆展