【摘 要】
:
伴随着各大互联网公司的飞速成长,大量的互联网应用如雨后春笋般出现在人们的生活中。大数据时代事实上的标准Hadoop YARN (Yet Another Resource Negotiator)也被成功地应用
论文部分内容阅读
伴随着各大互联网公司的飞速成长,大量的互联网应用如雨后春笋般出现在人们的生活中。大数据时代事实上的标准Hadoop YARN (Yet Another Resource Negotiator)也被成功地应用到越来越多的业务场景中。YARN对批处理任务的执行效率得到了较大提高,然而,传统的YARN在分配资源后应用所得到的资源量固定不变,这种资源分配方式对运行在其上长任务运行的支持存在不足。长任务会以后台服务的形式在集群中长期运行,其每个并行的子任务对资源的需求量会随着应用的不同阶段的忙闲而发生变化。在这种情况下,如果为集群中运行的任务分配固定大小的资源量,将无法满足应用在运行期不同阶段的资源需求。同时,现有的Hadoop集群在运行期的集群规模恒定,Hadoop集群难以在运行时期根据自身对资源的需求扩充集群规模。这对资源需求变化的长任务来说也缺乏足够的灵活性。针对以上YARN对长任务资源分配的缺陷,本文提出了一种支持长任务的并行计算动态资源分配机制的解决方案EDCP (Elastic Data Computing Platform), EDCP结合了云计算环境和YARN各自的优势,使得EDCP可以在运行期扩充集群的规模,同时,EDCP根据每个子任务的负载优化长任务的资源使用量,从而使可以为应用创建更多的容器资源,并在集群资源不足时为集群部署更多的计算节点,为长任务的运行提供了更灵活的资源分配机制。本文通过实验对EDCP的功能和性能进行了测试,验证了 EDCP可以在集群运行时水平扩展集群的规模,实验结果显示与传统YARN相比,可以将WordCount和TeraSort等计算密集型任务的运行时间缩短至原有时间的0.7至0.9倍。
其他文献
当今人们对于移动通信的容量和效率的需求迅猛增长,但是在现有的常见通信环境和通信技术条件下,小区内的通信容量常常捉襟见肘,用户体验有待提高。所以现在移动运营商在进行
本论文从金属氧化物Ce02着手,采用水热法制备了不同形貌的CeO2,分别为纳米立方体、纳米八面体、纳米纺锤体、纳米球、纳米棒、纳米片、纳米线、纳米杆和花状结构。通过浸渍法
研究区位于小兴安岭—松嫩盆缘多金属成矿带、弓棚子-五道岭铜钼铅锌钨成矿亚带,即“弓棚子—平山铜铁多金属Ⅰ级远景区”的南段。区域具有良好的找矿潜力,区内发育宾县弓棚
本文所研究的沁南区块位于沁水盆地南部东翼斜坡部位,纵向上发育多套煤层,其中横向较稳定、厚度较大的是石炭系太原组15号和二叠系山西组3号煤层。沁水盆地是形成于古生界基
本文立足于已经成功应用于合成生物可降解高分子材料的金属配合物的基础上,设计并成功合成了一系列多齿氮配位金属有机化合物。此中,把成功合成的镁/铝物质应用于合成PCL的反
高性能计算机的硬件性能的提高,需要有相应的软件支持,才能在实际使用时发挥出硬件系统的性能长处。超算系统的应用程序在固定的硬件平台上会被用户多次运行,应用程序在具体
传统微电子器件在纳米尺寸下的能耗问题成为当今微电子行业进一步发展的瓶颈。利用电子自旋性质制造的新型电子器件有望解决这一难题。自旋电子学作为一种意在利用创新的办法
随着大规模新能源接入电网后,由于常规电源发电占比下降、下调峰能力的限制以及就地消纳空间有限等因素导致系统调峰能力不足,风光电消纳受阻,系统弃风弃光现象严重。因此,如何提高系统调峰能力以及挖掘电网中新的调峰资源成为我国电网目前亟待解决的问题。太阳能光热发电是近年新崛起的一种新能源发电类型,其既具有利用光伏发电的新能源特征,又具有常规电源发电功率平稳性与良好的调节特性。基于此,本文在考虑传统常规电源调
长期以来,人们用电阻率测井来识别油水层,但由于低电阻率油气藏与水层的电阻率差异不大,在以往的常规测井解释中容易被错误的判断为水层。低阻油气藏具有隐蔽性强和巨大的勘
鄂尔多斯北部气田主要包括大牛地、什股壕两个工区,大牛地工区内水平井测井资料稀缺,水平段仅有自然伽马曲线,什股壕工区储层发育多以砂泥岩薄互层为主,水平井测井响应受围岩