基于随机模型的云服务可用性分析研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:softguner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算(Cloud Computing,CC)的蓬勃发展,越来越多的关键业务应用迁移到云数据中心,并通过云数据中心向用户提供服务。云计算提供多种服务模式,其中基础设施即服务(Infrastructure as a Service,Iaa S)将IT基础设施(如服务器、存储和网络等)作为一种服务,以虚拟机(Virtual Machines,VMs)或虚拟链接(Virtual Link,VL)的方式通过网络提供给用户,这些虚拟机部署在云数据中心的物理服务器上,每个虚拟机分配有不同规格的虚拟内核、内存和存储容量,用于适应多种类型的服务需求。在规模庞大且策略多样的云数据中心,服务延迟事故、基础设施故障事故和安全事故不可避免。而可用性作为评估计算资源可被授权实体按需求访问、正常提供服务或在系统发生故障及遭受攻击时恢复使用能力的度量指标,正在成为用户选择云服务提供商(Cloud Service Providers,CSPs)的主要关注点。与此同时,可用性分析还有助于优化系统设计并降低建设成本,为建立高效的云数据平台提供指导。因此,随着Iaa S云服务的广泛应用,无论云用户还是云服务提供商都对云服务可用性评估愈加迫切。本文针对具有规模大、异构性和动态性等特点的Iaa S云数据中心,建立稳态可用性和瞬态可用性分析模型,研究评价指标计算方法,评估各种因素对可用性指标的影响规律。本文的主要研究内容及其贡献包括以下四方面:(1)提出了面向多资源类型的云服务可用性分析模型。该工作旨在从云数据中心服务能否满足用户质量需求的角度出发(关注云服务好不好用),在假设物理服务器不会发生故障的前提下,建立面向单物理服务器服务能力的整体分析模型,并以作业立即服务概率和平均完成时间作为度量指标,评估由相同物理服务器组成的云数据中心在不同用户请求负载下的服务可用性。首先,我们分析了多资源类型云数据中心的服务特点,其中用户请求的计算资源类型和数量均存在差异,且数量上遵循一般概率分布。随后,建立一种基于连续时间马尔可夫链(Continuous Time Markov Chain,CTMC)的单物理服务器整体分析模型,详细描述状态转移规则,并推导出立即服务概率和平均完成时间两个云服务稳态可用性度量指标的计算公式。最后,设计数值分析和仿真实验对模型正确性和有效性进行验证,在多种参数设置下验证模型的近似精度。本研究建立的可用性分析模型相比于单一资源模型考虑更加全面,更能够反映云服务实际运行状况,提高了可用性评估的准确性。(2)针对不同修复策略下的Iaa S云数据中心物理服务器可用性,提出了可用性整体分析模型和交互式分析模型。该工作旨在从云数据中心物理层面(如物理服务器)能否正常运行并提供服务的角度出发(关注云服务能不能用),建立面向多物理服务器的整体分析模型和交互式分析模型,并以平均可用物理主机数量和系统拒绝服务时间作为度量指标,评估其在不同运行策略下的物理服务器稳态可用性。首先分析了Iaa S云数据中心特点,包括规模大、修复策略和物理服务器异构、动态迁移等,并对系统进行描述。随后,提出了云数据中心物理服务器的可用性整体分析模型及其度量指标,分析不同修复策略和系统参数对云数据中心可用性的影响。同时,为了克服大规模云数据中心整体分析模型的局限性,进一步将其分解为多个交互式子模型,并提出各子模型之间的参数依赖关系,建立了一种新型交互式分析模型。最后,在不同参数设置下开展实验,通过对比整体模型和交互式模型的实验结果,验证了交互式模型的准确性;并通过对两种修复策略下交互式模型的实验结果进行对比,评估了不同修复策略和修复能力对云服务可用性和建设成本的影响。本研究建立的整体分析模型和交互式分析模型更加全面且更接近真实运行环境,实现了对大规模状态模型的求解,提高了可用性评估的准确性,同时对比出不同修复策略的优劣点。(3)提出了交互式模型中连续型参数的敏感度分析方法。该方法能够对分布在不同子模型中的同一参数,进行统一敏感度分析。该方法首先求解每个子模型中相关参数的敏感度,然后分析每个子模型中涉及参数的敏感度等级,按照敏感度影响大小进行排序并忽略影响较小的参数,最后综合应用几个子模型的计算结果,确定出影响系统可用性最显著的参数。利用该方法验证了不同修复策略和系统参数对可用性的影响程度,实现了对大规模云数据中心的参数敏感度分析。(4)提出了云服务瞬态可用性分析模型。对于关键应用领域的Iaa S云数据中心,需要全面衡量其可用性,不仅要分析稳态指标,还应考虑系统在面对瞬时发生的蓄意攻击、故障失效或偶发事故时,其仍能提供服务的能力。该工作针对一个存在渗透攻击安全漏洞的Iaa S云数据中心,建立了瞬态可用性分析模型,该模型更接近真实运行场景,允许攻击者以不同的入侵能力通过被入侵的服务器对其它服务器进行攻击,并且入侵后数据窃取和数据泄漏的速率随服务器数量动态变化。模型可捕捉从Iaa S云数据中心物理服务器首次被入侵到防御机制生效期间,系统和入侵者的行为,并以某一时刻被入侵、数据泄露和安全状态的概率,以及系统损失量作为度量指标,提出计算方法,最后通过仿真实验结果验证了模型的近似准确性,本研究有助于云服务提供商制定系统防御计划,并在系统损失与防御成本之间进行权衡抉择。
其他文献
移动互联网以及物联网的迅猛发展给人们的生活带来了深刻的变革,同时也给传统的信息安全技术带来了新的挑战。身份认证是保障信息系统安全的第一道防线,如何对用户的身份进行
随着计算机和互联网应用技术的快速发展,数字媒体在人们的日常生活中得到了日益广泛而深入的应用,这些通过公开网络传输的数字媒体信息极易遭到非法拦截、篡改和攻击,如何保
机动目标跟踪一直是目标跟踪领域中的难点问题,尤其是对多机动目标跟踪。由于目标数的变化,目标新生和消失,以及目标相互紧邻、交叉等复杂场景,使得跟踪变得更加困难。针对该
随着大数据时代的到来,林业相关部门在日常活动和信息化建设的过程中产生大量有价值的数据信息。但是,对于网络上分布的海量林业文本来说,主要存在以下两个特点:一是文本数量
全球化程度不断加深,生物安全形势已发生转变,加上在当前抗击新冠疫情的背景下,习近平总书记提出要将生物安全纳入国家安全体系,全面提高国家生物安全治理能力。虽然近年来我
卫星云图是由气象卫星自上而下观测到的地球上的云层覆盖和地表面特征的图像。利用卫星云图可以识别不同的天气系统,确定它们的位置,估计其强度和发展趋势,为天气分析提供依
我国《担保法》及其司法解释规定了保证人求偿权,以保障保证人的合法权益,而对于保证人代位权并未有该字样的出现,理论界对我国法律是否规定了这一权利存在不同的看法,各级人民法院在司法实践中关于此类案件的定性及处理方式存在多样性的特点。其分歧集中于以下问题:首先,保证人代位权是否是存在的,有无存在的必要性;其次,该权利与保证人求偿权之间是何种关系;最后,在司法实践中保证人应如何行使自己的权利。本文拟从立法
互联网信息技术蒸蒸日上,互联网上所存储的信息与日俱增。大数据来临的时代,科学、金融等各个领域如鱼得水飞速发展,人们需要处理过去计算机架构无能为力的数据。云计算作为
全球碳循环变化是全球气候变暖的重要影响因素,探究陆地生态系统与大气碳交换模型并分析碳通量与各生态因素的响应关系,具有重要研究价值。当前,基于生态机理建模和基于生态
有机薄膜晶体管由于其柔性可穿戴、成本低、可低温制备和大面积生产等特点,被应用于有源矩阵平板显示、电致发光二极管和“电子纸”显示等。然而,由于有机半导体无法实现稳定的重掺杂,导致其有机半导体与电极之间无法形成欧姆接触,存在较高的肖特基势垒,极大地影响了有机薄膜晶体管的性能,阻碍了低功耗和高增益有机薄膜晶体管的实现与发展。因此,我们需要深入研究有机薄膜晶体管的肖特基势垒,并做到其势垒高度可调控,实现欧