集群计算效率约束下的HADOOP鲁棒性优化研究

被引量 : 0次 | 上传用户:lszh123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展以及全球数据量的激增,云存储与云计算是未来的发展趋势,传统数据库对数据的处理已经越来越不能满足个人与企业用户的要求,对于海量数据,业界大数据存储及分布式处理系统最有代表性的就是Hadoop。Hadoop在最近几年迅猛发展,它是一个具有可靠性、高效性、可伸缩性的能够对大量数据进行分布式处理的开源软件框架。由于设计Hadoop之初是假设集群所有机器都是同构的,而现实中,Hadoop集群是有许多廉价机器组成,这就导致了集群中的节点计算能力的差异以及节点容易失效的问题,虽然Hadoop为了防止计算任务和数据存储可能会失败而维护了多个数据副本,以提高集群的容错能力与可靠性。但是在预测节点失效与数据副本放置以及任务调度上仍然需要完善和改进。为了提高Hadoop集群的鲁棒性,本文在不同性能的节点执行任务效率的差异下对其鲁棒性进行了优化,研究的主要内容如下:(1)针对Hadoop在任务节点的选取与数据副本放置时未考虑节点未来可能会失效的问题,提出了Hadoop节点故障预测模型,对集群中的节点进行了故障率预测。(2)通过节点故障预测模型,对于Hadoop任务调度进行了优化以及提出了关于数据副本放置的节点选择策略算法。解决了默认算法未考虑节点异构性而造成的计算能力差异的问题,提高了集群的鲁棒性。(3)对于集群中执行任务次数较少以及通过节点故障预测模型判断出高故障率的节点,建立了休眠机制,解决了该类节点的处置问题。(4)通过搭建Hadoop集群验证了故障预测模型在集群计算效率约束下的有效性,本文所提出的方法提高了Hadoop集群的鲁棒性。
其他文献
土地是人类生存和发展的物质基础,是不可再生资源,也是社会经济发展的先决条件。然而,随着经济的发展、人口的增加、工业化和城市化的日益加剧,人类对土地资源的需求也与日俱
<正>在云南各民族中,民间普遍把刺绣叫作"绣花""洒花",运用数以百计的刺绣针法与材质色彩各异的绣线巧妙结合,加上设计布局的变化,云南众多少数民族创造了无数独具魅力且寓意
随着互联网技术的发展和Web用户和数据的飞速增长,有必要对网络的用户进行追踪和分析.本文首先分析了Web使用挖掘的数据源,然后详细介绍了数据清洗、用户识别、网页浏览识别
为将甪直打造成一流的模具特色小镇,针对小镇的建设进行整体规划。对甪直模具特色小镇的产业定位和创新创业环境等内容进行深入分析,规划整体布局,提出发展目标、愿景及"六个
客户需求是产品开发设计的起点,根据当前大批量定制的主要研究方向以及现有优化研究方案的不足,对面向大批量定制的客户需求聚类分析及优化方法进行了初步探索。描述了面向客
彭信威先生的1965年版(《中国货币史》已由上海人民出版社重印,受到钱币学界和货币史学界的普遍欢迎,对进一步加强中国钱币学和货币史的研究,提高这两门学科的学术水平必将
竹笛是我们非常熟知的民族乐器,至今已有几千年的历史,它具有极其丰富的表现力和独特的演奏技巧,其因较小携带方便,从而使它能够长期不断的广泛流传。竹笛能够表达人们思想感情和
阐述了铝合金建筑型材阳极氧化膜封孔工艺参数的控制要点,并介绍了封孔质量检测的仲裁方法。
20世纪90年代开始,合作学习这一教学理念和策略体系在我国得到了关注和研究之后,作为一项重要的学习方式在中小学课堂教学中被推行和广泛使用。但是,课堂中出现的"责任分散效