【摘 要】
:
Hadoop已经成为一个重要的并行处理大规模数据密集型应用的云计算模型。但近年来,针对Hadoop的研究却往往忽视了在异构环境中对其性能影响的问题。本文针对异构环境中广泛存
论文部分内容阅读
Hadoop已经成为一个重要的并行处理大规模数据密集型应用的云计算模型。但近年来,针对Hadoop的研究却往往忽视了在异构环境中对其性能影响的问题。本文针对异构环境中广泛存在的数据分配问题和数据局部性问题进行了深入的研究,分析了其产生的原因,提出了解决的途径及具体实现机制,最后对修改后的模型进行了性能分析和评估。本文分析了Hadoop在特定的异构环境中由于节点间的数据传输造成性能下降的原因,并研究了现有解决方案的设计思想,根据其不足和缺陷,提出一种新的HPDD数据分配机制,用于解决数据分配问题。HPDD能根据每个节点的计算能力分配初始数据到HDFS的DataNode节点,从而降低异构环境中高性能节点和低性能节点之间移动的数据量,减少因数据歪斜而产生的数据传输。提出了在MapReduce执行过程中JobTracker和TaskTracker之间广泛存在的依赖关系,指出了该过程中的数据局部性问题。设计并实现了PRM预取机制,以并行化的形式工作,在上一个任务执行时,利用空闲的网络I/O带宽,将输入数据从远程磁盘预加载到执行该任务的TaskTracker所在的本地高速缓存,从而避免了网络I/O占位,使该TaskTracker能在没有任何延迟的情况下执行该任务,提高其整体性能。最后,针对本文提出的两种机制进行了实验验证,对其数据分配和预取过程进行了实现,实验结果表明了该两种机制的可行性及有效性,能够很好地提高Hadoop在异构环境中并行处理大型数据的能力。
其他文献
<正>核心阅读:作为国内刚刚出现的新型新闻生产方式,"新闻众筹"一出现便受关注,其制作流程门槛低并体现出"你支持,我报道"的大众参与的特色。新闻众筹使新闻生产的门槛降低,
世界许多国家均面临人口老龄化的问题,对于发病以老年人为主的骨质疏松症而言,其全球发病率排名已上升至第 6 位。骨质疏松症被称为“无声杀手”,患者需要面临巨大的痛苦与高
目的探讨Beclin-1蛋白在霍奇金淋巴瘤((?)lodgkin lymphoma,HL)组织中霍金里斯(Hodgkin Reed-Sternberg,HRS)细胞的表达及其与HL患者临床特征之间的勺关系。方法收集2001年1
随着中国工业化和城市化进程的加快,越来越多的农村剩余劳动力进入城市务工就业,他们的子女也随父母进入城市,被称为“流动儿童”。伴随着大量农村剩余劳动力进城这一不可逆
达泊西汀原本是一种用来治疗抑郁症的选择性5-羟色胺再吸收抑制剂,但相关医学临床试验数据显示其治疗男性早泄疗效显著,具有很广阔的市场前景。近年来,达泊西汀合成方法的研
魔芋飞粉是魔芋精粉加工中的副产品,资源丰富,富含淀粉。酿制“魔芋飞粉威士忌”,不仅可以变废为宝和降低环境污染,又可丰富魔芋食品的种类及促进酒精饮料业的发展,具有良好
磁性碳纳米复合材料已成功制备且用于水环境中有机污染物的吸附去除。多环芳烃PAHs)是一类广泛分布的有机污染物,有强致突变、致癌性,并且可能是内分泌干扰物。现在人们更多
在梳理绅士化运动的内涵、动力机制及其影响的基础上,以包头市东河区为实证,指出了包头市东河区绅士化进程与城市更新的互动关系,并针对其中存在的问题,提出加强政府引导,加
文章通过对中西方节日的比较寻找他们的差异和共同点,根据分析结果探索提升中国文化软实力的方法,指出民歌可以成为文化传播的优秀载体。
信息时代大学生面临各种新闻信息的冲突和挑战,其中网络负面新闻对大学生的影响尤其突出,在此背景下,加强大学生法制观念、提高高校法制教育质量,首先要明确大学生法制观念在