分布式云平台资源优化问题研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:xiangzuobuxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网与计算机技术的快速发展,人类逐步踏入一个由庞大数据所支撑的信息社会。近年来,对于海量数据的存储和计算成为学术界以及工业界重点关注的问题之一,尤其是以Hadoop和Spark为代表的云计算生态组件被广泛应用于数以千计的业务场景下。但是,随着数据中心规模的不断扩大,运维及资源开销成本的日益激增,人们在追求计算性能提升的同时,开始关注于偌大集群的资源优化问题。基于上述背景,本文着重对Hadoop及Spark分布式计算平台在资源消耗方面的优化问题进行研究,具体工作主要包含以下四个方面:1.提出了一种面向Hadoop2.0的资源消耗预测模型。模型构建包含三步:首先,构建单任务模型,基于MapReduce流程仿真与日志分析,拟合单任务资源消耗与数据量间的变化关系;其次,利用皮尔逊假设检验方法,对并行场景下MapReduce各阶段执行时间的分布进行估计;最后,提出以平均场模型为核心的任务再生与调度策略,将赋予时间估计值的单任务模型在时间轴中进行横向追加与纵向累积,以平均效应替代叠加效应,实现对Hadoop2.0集群各项资源消耗(CPU、内存、磁盘读写、网络读写)及应用程序执行时间的预测,并在真实生产集群中验证了该模型的有效性。2.设计了一种广义分布式云计算环境下的资源消耗基准成本模型。首先定义了各项资源单位时间成本消耗的计算方式,以此消除资源实例间的量纲差异;之后,设计了基于时间定积分的整体成本计算模型,对各项资源消耗成本进行统一计算。该模型有助于资源消耗的计算整合,并可以可插拔的方式与任意成本优化算法进行耦合。3.构建了一种基于数据持久化的Spark资源消耗成本优化模型。首先,定义成本最优化问题,将Spark计算流实例化为有向无环图,并将有向边赋予成本权重;其次,设计成本优化策略,通过对比图中各RDD计算资源与存储资源的成本,提出局部预优化策略。针对Spark链式计算的数据依赖特性,进一步提出前驱数据集合优化策略,用于更新被持久化RDD前驱数据分片的成本消耗。此外,该模型通过引入故障率参数来构建针对单任务长链条计算场景下的持久化数据释放策略,对整体成本消耗做进一步优化。通过粗细粒度的实验分析,验证了该方法的可行性和有效性。4.提出了一种面向分布式云平台资源优化模型的系统集成架构。该架构包含数据层、核心决策层以及应用层,具有较高的可扩展性,可实现由日志输入便可得到输出结果的应用模式,避免过多人工干预,较好地满足工业生产所需。两项案例展示与分析表明,该系统在使用方法及输出形式上具有较好的可用性和直观性。
其他文献
现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)作为一种高集成度的半定制专用集成电路芯片,具有高并行性、高速度、低功耗、低成本的优势,被广泛的应用于大型数据中心、云服务平台中实现任务加速处理。随着动态部分可重构(Dynamic Partial Reconfigurable,DPR)的FPGA(DPR-FPGA)出现,FPGA的灵活性和开发潜力得到了进一步
含氮杂环化合物是一类十分重要的化合物,广泛存在于众多药用价值的化合物中。关于含氮杂环化合物的合成方法已被广泛研究。该论文主要的研究是无过渡金属参与条件下的两类含氮杂环化合物的合成研究,一类是酸促进的二芳基炔烃串联羰化双环化反应,另一类是无过渡金属催化下酰胺重氮的氟化芳基化反应。一、酸促进的二芳基炔烃串联羰化双环化反应我们发展了一例原子经济性高的二芳基炔烃串联羰化双环化反应,高收率的合成了一系列的多
场景感知(context awareness)计算是智能交互的关键技术,也是物联网研究领域的重要课题。现实生活中,应用在不同场景下所提供的服务有所不同。而场景感知为上层应用提供重要
为了进一步扩展RFID系统的通信距离,本文研究了基于RFID的双基地通信系统,该系统是受雷达通信启发,演变而来的一种新型RFID通信系统。在介绍双基地通信系统架构和原理的基础上,通过理论分析,阐述了该系统在信号功率衰减、通信距离、载波自干扰和成本等方面的优势。之后,使用信号发生器、板级标签、半有源标签和软件无线电(Software-defined radio,SDR)搭建了双基地通信系统模型,并对
随着互联网的发展,越来越多的色情图片、视频等资源充斥于网络,对互联网用户,特别是青少年带来不良影响。高效的色情视频检测手段成为迫切需要。本文首次将非监督学习的思想引入到了色情视频检测方法中,不同于利用传统的人工设计特征来判别视频,本文采用神经网络自学习的方式提取特征,再利用分类器对特征进行训练、分类,达到判断视频中是否含有色情内容的目的。本文提出了一个基于多模态非监督特征的色情视频检测算法,在该算
近年来,我国互联网行业不断发展,网民总数不断增长,网络游戏、网络文学和网络视频形成网络娱乐类应用三足鼎立的局面。其中,网络视频占比最大,同时,网络视频用户的增长率远高于总体网民的增长率。过去的几年里,视频网站为了争夺用户,不惜重金打响版权之战。当一些传统媒体开始互联网转型,收紧版权分销,视频网站逐渐认识到购买版权并不能形成真正的竞争壁垒。同时,在版权购买压力下资金问题日益凸显,各视频网站纷纷将目光
考虑到双边道德风险、逆向选择在私募股权投资活动中导致了十分复杂的委托代理问题,是投资活动中不可忽视的重要因素,本文从理论角度入手,基于拓展的委托代理模型,创新地研究了存在双边道德风险、信息甄别且私募股权投资者具有谈判控制权情况下的最优合约(包含股权划分合约以及对赌协议两部分)形式,再从实证的角度试图论证理论结果。在理论方面,通过构建模型发现,当双边道德风险与逆向选择均存在时,投资者无法通过与企业签
奴拉赛铜矿床位于新疆西天山阿吾拉勒西段。矿体呈脉状、条带状,产在矿区两条主断裂中及断裂附近的地层、岩体和角砾岩中,受构造控制明显。围岩为下二叠统乌郎组玄武岩、凝灰岩,上二叠统晓山萨依组砂砾岩,花岗斑岩体及它们的断层角砾岩。矿石主要呈块状、条带状构造、脉状构造和浸染状构造等等,矿石中的金属硫化物主要为辉铜矿和斑铜矿,亦含有少量的黄铜矿、黄铁矿,脉石矿物包括方解石、重晶石及少量石膏。围岩蚀变主要表现为
随着十八大的召开,国内经济发展形势起着翻天覆地的变化,很多经济结构都出现了转型升级的情况,这在一定程度上促进了社会经济的增长。民航业在“一带一路”、“供给侧改革”
随着人们消费水平的提高,高音质Audio Codec逐渐成为人们追求的目标。信噪比(SNR)、总谐波失真加噪(THD+N)、带内平坦度是衡量Audio Codec保真度的关键参数。为追求高信噪比,多数Audio Codec芯片中的ADC采用了Sigma-Delta结构的模拟调制器进行量化噪声的整型,数字滤波电路进行后续的低通滤波。由于该应用中数字滤波常使用较多的乘法器,硬件资源消耗严重,且级联的数