SaaS环境下易并行应用的性能分析与优化研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:axian190
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算是一种基于互联网的资源共享模式,其利用虚拟资源管理和分布式计算等技术管理计算资源,并以在线和按需的方式向用户提供计算服务。根据提供服务类型的不同,云计算可以分为三个层次的服务,分别是基础设施即服务(Infrastructure-as-a-service,IaaS)、平台即服务(Platform-as-a-servic,PaaS)和软件即服务(Software-as-a-service,SaaS)。其中,SaaS是把软件应用定位成共享的云服务,能够直接满足用户的应用软件需求。本文主要关注的是SaaS环境下一类广泛存在的应用—易并行应用,该类应用的特点是所提供的服务之中有一个或者数个易并行服务。易并行服务的任务可以分割为多个独立的、无依赖的子任务,这些子任务可以在不同服务器上并行执行。SaaS环境下的典型易并行应用有渲染应用、翻译应用、大多数的数据处理应用以及大多数的机器学习应用等。随着云计算的蓬勃发展,尤其是数据密集型计算领域的兴起,SaaS环境下易并行应用的工作量急速增加,这对SaaS提供商的应用性能管理提出了更高的要求。一方面,针对不同类型的易并行应用,SaaS提供商需要研究系统配置、任务负载和性能指标之间的相互关系,优化云资源配置、任务执行策略和资源分配算法,进而高效地、可靠地处理大批量的用户任务;另一方面,为用户任务分配云资源时,SaaS提供商需要考虑多样化的用户服务质量请求,在保证用户服务质量的前提下,提高任务执行效率,减少资源消耗。目前,由于云架构的可伸缩性、易并行应用的多样性和用户任务的复杂性的限制,国内外关于SaaS环境下易并行应用的性能管理的研究还存在很多不足。例如,现有的性能管理研究很少考虑云环境下易并行应用的特征以及并行化对资源利用率的影响,对用户需求及任务的多样化约束考虑的也并不全面。因此,为了提高SaaS环境下易并行应用的性能管理水平,优化不同类型易并行应用的服务质量,本文从性能分析模型和资源分配算法两个方面开展了以下四个研究。(1)针对SaaS环境下的易并行独立应用,基于排队理论和马尔科夫理论,本文提出了适应多并行度分割的多站多服务器排队性能分析模型。可靠的性能分析模型可以帮助易并行应用确定合适的任务并行度,进而大幅度地减少任务执行时间,提高应用的性能。为了在SaaS环境下建立有效的易并行独立应用的性能分析模型,本文将易并行独立应用建模为多站多服务器的服务系统,面向易并行独立应用提出了基于M/M/c/r排队系统的性能分析模型。该模型可以预测不同系统设置下的重要性能指标,进而指导SaaS提供商制定最佳的应用系统设置,如服务器数量、缓存容量和并行度等,最终提高SaaS应用的性能。(2)为进一步优化SaaS环境下易并行独立应用的性能,本文制定了针对易并行任务的差异化并行处理策略,并基于排队理论,面向易并行应用提出了并行多队列多站的性能分析模型。该差异化并行处理策略可以根据任务对应用性能影响的差异,对任务进行差异化的处理,进而提高应用的服务质量。然后,为了分析不同任务的处理方式以及资源分配情况下的性能差异,基于该策略,本文提出了并行多队列多站的易并行独立应用分析模型,该模型可以指导SaaS提供商为不同的任务确定最优的并行度和资源分配方案,进而优化SaaS环境下的易并行应用的性能。此外,本文还提出了一个新的度量指标来量化不同任务的性能优化水平,从而避免在性能优化过程中出现任务性能恶化的情况。(3)针对SaaS环境下易并行服务组合应用的性能分析和优化问题,本文提出了两种性能分析模型,分别是并行多站串联排队网络模型和多类多池分析模型。该性能分析模型可以为SaaS环境下不同类型的易并行服务组合应用提供准确的性能预测。本文一方面分析了不同服务之间时间依赖和资源约束的关系,并为易并行服务组合应用构建性能分析模型;另一方面基于分析模型的预测结果,提出了高效的任务处理以及资源分配策略,进而优化易并行服务组合应用的性能。(4)针对用户对应用服务质量需求多样性的问题,本文将其深化为公平与效率的冲突问题,分别在资源竞争和非竞争情况下,为SaaS环境下的易并行应用提出了公平高效的资源分配算法。由于用户服务质量需求的多样性,SaaS提供商通常向用户提供多层次SLA(服务水平协议)。为了在任务处理时满足用户多层次的SLA,本文提出了加权加速比公平性定义。然后,为了提高执行效率、协调效率和公平性,在加速比公平原则的指导下,针对资源竞争和非竞争两种情况,本文提出了公平高效的资源分配算法。此算法可以在满足用户不同SLA的同时,最大限度地提高任务的执行效率。
其他文献
研究背景心血管疾病是人类死亡的主要原因,各种危险因素导致的血管重构和动脉粥样硬化是常见的病理基础。临床和病理研究表明,动脉粥样硬化病变主要发生在血管分叉、弯曲以及狭窄区域,高血压可引起血管壁细胞增殖、血管壁增厚,介入治疗术后异常血流可引起血管增生和再狭窄。这些因素提示血管力学因素是血管重塑和动脉粥样硬化形成的重要诱因。血管重塑主要表现为血管平滑肌细胞(VSMCs)的异常增殖、凋亡和迁移。血管内皮细
很多家实验观测到宇宙线全粒子谱能谱在几个PeV处有“膝”的结构,原初宇宙射线全粒子能谱膝区的物理特征对于研究宇宙线的起源、加速和传播机制非常重要。高能宇宙射线的质量组分是解释宇宙中这些高能粒子的起源、加速和传播机制的关键之一。我国科学家提出的高海拔宇宙线观测站(LHAASO)项目,目标是探索高能宇宙线起源、开展北天区伽马源扫描搜索等,膝区宇宙线成分测量是该项目的重要研究内容。LHAASO建设在中国
有机半导体包括有机小分子和高分子,因其质轻、柔性、制备简单等优势,在传感器、激光器、光开关和太阳能电池等方面具有广泛的应用。与无机半导体不同,有机半导体具有较强的电子-晶格相互作用,这导致掺杂的电子和空穴能够使晶格畸变,从而形成自陷的元激发,如孤子、极化子和双极化子。另外,通过光或者电激发形成的中性激发态,如激子和双激子,除了存在电子和空穴之间的库仑相互作用外也会受到局域晶格势场的束缚。这些独特之
本论文主要研究R2n中P对称紧凸超曲面上的闭特征问题,P为辛矩阵且满足P-I2n可逆以及存在正整数m>1使得Pm=I2n。本文包含三个方面:闭特征多重性问题,稳定性问题以及共振恒等式(即闭特征之间的关系)。对于多重性问题,本文主要应用M aslov-型指标迭代理论以及M aslov指标理论证明了如果P满足Pm=I2n且辛相似于R(-θ)◇n-[n/2]◇R(θ)◇[n/2],则任意的P对称紧凸超曲
随着大数据时代的快速发展,各式各样的数据不断产生,数据成为了重要的战略资源。如何高效而精确地处理这些规模庞大、种类繁杂并且快速增长的数据是各个行业在激烈的竞争中抢占先机的关键因素。但是,很多经济实力薄弱的用户无力承担购买和维护数据处理设备的高额成本,因此,这些用户会因不具备处理复杂数据的计算能力而失去竞争优势。此外,在物联网、车联网以及可穿戴医疗设备等新兴技术中,终端设备为了做出精确的响应,需要对
随机图理论起源于Erdos和Renyi在1959-1968年间发表的一系列论文。该理论经过几十年的发展目前已成为一个独立且发展迅猛的离散数学分支,位于图论、组合论和概率论的交汇处,在理论计算机科学、自然科学和社会科学中有着广泛的应用。随机扰动(超)图是近年来引入的一种图模型,其目的在于研究少量随机(超)边扰动的情况下对于图性质的影响。在第二章和第三章,我们研究了哈密尔顿圈的幂、完美匹配以及因子在该
众所周知,博弈论是对多个主体制定策略的研究。从控制论的角度来说,我们可以把它看作是一个高维最优控制问题。博弈问题中的数学模型有很多种,例如,按参与者之间的关系来划分,可以是合作关系,也可以是冲突(非合作)关系,它在金融市场、管理科学、计算机科学、物理、化学等领域有着广泛的应用。最早的研究是关于零和博弈的,即所有参与者的总利润是等于他们的总损失的。这是非合作博弈的一个特例,现在我们把纳什均衡策略称为
水汽虽然占总的中性大气含量不足4%,但它却是地球中性大气的重要组成部分。一方面,它是大气能量传递的基础,水在低纬度地区被蒸发吸收热量,水汽被输送到高纬度地区凝结,释放出大量的热量。另一方面,水汽也是地球上最重要的温室气体之一,对全球气候变化有着重要影响。此外,水汽在大气水文循环中也起着关键作用,在风的作用下,水汽围绕地球移动,为云层和降水的形成提供水源。因此,了解水汽的变化对于气候特征和气象监测研
发达国家50岁以上人群里,每年患有不同类型骨骼疾病的人数逐步增多,社会人口逐渐呈现老龄化的趋势,因各种原因造成的关节损伤人数也在不断增加,人工植入体的需求日益增多。近等原子比的NiTi合金因其优异的形状记忆效应和超弹性、良好的机械性能、较好的耐腐蚀性和生物相容性,在医疗植入领域得以广泛应用。本文以Ni50.8at%Ti形状记忆合金为研究对象,提出铣削-电化学抛光加工工艺,揭示铣削加工表面完整性的影
随着高通量测序技术的发展,大规模基因表达数据的积累速度越来越快。如何借助数学方法从海量的表达数据中挖掘有效信息成为了一个极大的挑战。表达数据中一个至关重要的信息就是基因表达的相关关系。它可以帮助我们实现对未知基因的功能注释,理解基因间的调控关系,从而更好地了解复杂疾病的机制。这对发现癌症亚型、预测致病基因、药物筛选等有着极为重要的意义。但是不同于一般的数据,基因表达数据中参与同一调控机制的基因只会