面向云网络产品实例的诊断结果分析工具

来源 :浙江大学 | 被引量 : 0次 | 上传用户:sjtulzhff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的租户选择业务上云,以降低运维成本和提高服务质量。部署于云网络上的云网络产品通常采用虚拟化技术,使得同一台物理机上面的若干云网络产品实例可提供给不同的租户使用。然而,这种云网络产品共享同一物理设备的特性往往会使得云网络产品实例故障的危害性更大(例如,某实例异常造成CPU资源耗尽将导致其余云网络产品实例难以为其租户提供高质量服务),进而使得故障排查尤为复杂,最终极大地增长了故障排除所需的时间。因此,面向云网络产品实例的故障诊断研究对于保障云网络的可靠性与稳定性具有重要意义。目前,常见的面向云网络产品实例故障诊断方式主要分为以下两种:被动式故障诊断和主动式故障诊断。其中,被动式故障诊断由于其开销小,对租户非入侵的优点,被广泛应用于工业界。在本文所考虑的某大型云服务提供商中,就通过预设一系列实例级别的诊断规则(例如对CPU监测指标设定安全阈值、抓取软件变更相关事件日志等)来被动式地提取实例信息并输出诊断规则判定结果,从而实现云网络产品实例级别的故障诊断。然而,即便获得了实例级别的诊断结果,仍依赖专家知识进行人工排查,以获得最终的故障根因。这往往耗时耗力。如何进一步提升云网络产品实例诊断的效率,将是本文的重中之重。针对该问题,许多研究学者已对网络故障诊断进行了深入的研究,但现有研究成果多面向于大型网络系统,缺乏对云网络产品实例诊断结果再分析的研究,并且尚未在实际云网络数据中进行实验验证。对此,本文基于实际云网络诊断结果数据,创新性地提出了一种针对云网络产品实例诊断结果的自动化分析工具。该工具通过利用实例诊断结果的时序关联等特性,实现了云网络产品实例的故障检测和故障分类,从而减少了技术人员重复性推断工作,协助技术人员更高效地完成故障排除任务。具体而言,本文主要贡献可归纳为以下三点:(1)考虑云网络产品实例诊断结果数据的时序关联特性,设计了一种基于窗口化时序数据的多示例学习循环神经网络算法以进行故障检测,克服了单点时序数据难以深入刻画数据时序关联和故障标签粒度太大的难点,实现了准确的云网络产品实例故障检测,即准确识别实例故障所处的时间窗口。(2)考虑云网络产品实例故障类型与实例诊断结果的映射关系,将云网络产品实例故障分类问题抽象为码本的解码问题。针对解码算法复杂度过高的情况,提出了由码本矩阵优化算法和基于贡献度的故障搜索算法构成的基于改进码本方法的云网络产品实例故障分类算法,在不降低算法精度的前提下减少了码本矩阵的维数和候选解决方案集的基数,大幅提升了算法效率。(3)使用真实的云网络产品实例诊断结果数据对所提出的算法进行实验验证与性能评估。基于某大型云服务提供商的线上诊断结果数据,对故障检测模型在时序信息提取、分类准确度等性能进行了验证及分析,并在测试集数据上取得了 93.85%的准确率和92.07%的F分数。基于故障检测算法获得的真阳性故障数据,对故障分类模型在运行时间、分类有效率等性能进行了验证及分析,并获得了 92.59%的诊断率和85.70%的诊断有效率。
其他文献
目的 探讨丹酚酸B对糖尿病肾病大鼠肾脏的保护作用及可能机制。方法 36只SD大鼠随机分为对照组(control组)、糖尿病肾病模型组(DN组)和丹酚酸B治疗组(Sal B组),每组12只。于造模成功后第8周,生化分析仪检测各组大鼠血清肌酐(Scr)、尿素氮(BUN)、总蛋白(TP)、白蛋白丙氨酸氨基转移酶(ALT)、天冬氨酸氨基转移酶(AST)的含量;测定肾脏指数;HE染色观察各组大鼠肾组织病理学
飞机黑匣子是解开空难之谜的关键性数据记录仪器,在接触水的瞬间,黑匣子上的声信标会发出特定的脉冲信号。搜索失事飞机黑匣子的关键在于能否有效地检测识别特定的声信标信号。本文针对海上声信标信号识别问题展开研究,提出基于图傅里叶变换(Graph Fourier Transform,GFT)和卷积神经网络(Convolutional Neural Network,CNN)的声信标信号识别框架。首先在预处理阶
随着人工智能的飞速发展,机器学习逐渐趋向于大数据、大模型、大规模集群训练,这在加强机器学习能力的同时也对机器学习策略提出了更高的技术要求。围绕数据划分、任务分配、资源调度、通信优化,最终达到训练速度与收敛精度的平衡,分布式机器学习被越来越多的学者深入研究并投入到工业应用中。为了加快机器学习训练速度,实现更高效的计算与通信,本文围绕深度学习网络分布式并行策略和通信优化方案展开研究,主要研究内容如下:
随着科学技术的进步和车载电子设备的发展,车辆通信技术在加强道路安全,提升交通效率以及提供丰富的车载信息和娱乐服务等方面展现了极大的潜力,受到了广泛的研究。作为专用短距离通信标准,IEEE 802.11p标准是实现车辆通信的极具竞争力的标准之一。然而,车辆的高速移动和复杂的通信环境导致无线信道受到多普勒频移和多径效应的影响。而信道估计的性能直接影响了后续信号的解调。因此,车辆通信场景下的信道估计算法
物资是保障医疗工作正常进行的基础,随着智慧医院的建设其传统的自主招标模式已难以适应医院精细化管理的需求。为此,建立一个招标流程明晰、严谨、供需双方信息互通、全程实现内部控制、纪律监督的信息化招标体系就显得尤为重要。重庆大学附属肿瘤医院在对传统招标流程进行优化重组的基础上,开发创建了闭环式智慧招标采购体系,与传统招投标模式相比智慧招标采购体系更具备信息化、规范化、精细化的特点,更加符合智慧型医院建设
自动调制分类(Automatic Modulation Classification,AMC)是指接收方对接收信号采用的调制方式未知的情况下,根据接收信号确定所用调制类型的技术,是非合作通信系统中介于信号检测与信号解调之间的一项重要工作。由于无线网络用户增加、用户需求多样化,无线信道中的干扰和噪声日益严重、调制类别逐渐增多,使接收信号中的不确定因素增加,导致AMC算法无法有效完成分类任务。为了提高
近年来,语音逐渐成为人机交互的重要手段之一。在室内,噪声和干扰,以及由墙壁和其他物体表面反射引起的混响是造成语音质量和可懂度下降的主要原因。由于混响和语音之间的高度相关性,抑制混响是增强语音的一项艰巨的挑战。噪声和干扰则使得室内语音增强问题更为复杂。风噪声具有和语音信号类似的非平稳特性,使得室外语音增强面临挑战。本文将深度学习用于室内及室外语音增强,此外,将阵处理与深度学习相结合,以增强多通道麦克
近年来,深度网络已经在图像识别等计算机视觉任务上获得了突破性的进展,但是,想要将其部署到资源受限的平台上仍然困难重重。自适应推理技术希望通过根据样本难度动态分配计算资源实现模型部署时候的高效推理。多出口网络是最具代表性的自适应推理技术,它在卷积网络的不同深度处依次引入了一系列中间分类器提供预测出口,根据样本难易动态推理。但是训练多出口网络涉及到不同优化目标相互干扰甚至冲突的问题。目前优化多出口网络
[db:内容简介]
随着人类对海洋的深入探索,各式各样的水下装备得到了研制和应用。自主式水下航行器(Autonomous Underwater Vehicle,AUV)、水下滑翔机(Underwater Glider,UG)等水下无人平台成为研究热点。当执行长时间水下任务时,搭载各类传感设备的水下无人平台需要持续地获知位置信息。同时,水下感知数据只有与位置信息关联,才具有实用价值。因此,精确的水下移动节点定位技术对水