论文部分内容阅读
云计算作为一种新的概念在2007年成为了人们热议的话题,在随后的几年内云计算得到了快速的发展。从计算模式来看,云计算、分布式计算和网格计算有很多相似之处,深入研究云计算产生的背景就可以看出,云计算是在分布式计算和网格计算的基础之上发展起来的。以前的分布式计算和网格计算主要用于科学研究方面,随着互联网的迅速发展,分布式计算和网格计算的思想逐渐演化为一种更适合商用的计算模式-云计算。论文首先介绍了云计算与网格计算的相关背景知识,并分析了两者之间的区别,然后对云计算平台Hadoop核心组成MapReduce、HDFS(Hadoop Distributed FileSystem)和Hbase等的关键技术进行详细的分析与研究[1]。接着详细介绍了LSF(Load Sharing Facility)系统的架构组成,包括LSF base和LSF batch两部分,并对LSF的作业执行流程和系统负载均衡进行了深入细致的分析。论文在对Hadoop系统深入研究分析之后,发现Hadoop在面对企业级应用时有3大不足,分别是单点故障、调度算法单一、异构平台兼容性差[2]。针对这几点不足,论文对Hadoop系统与LSF系统进行了关联性整合,形成一个新的系统LSH(LoadShare Hadoop)。系统整合主要有两大结合点,第一,将LSF的作业控制机制LIM(Load Information Manager)、RES (Remote Execution Server)和SBD(sbatch,一个守护进程)加入到Hadoop系统的HDFS层与MapReduce层之间;第二,LSF的master节点与HDFS的NameNode之间通过开放接口共享信息。整合后的系统LSH有效地防止了Hadoop系统的单点故障问题,也解决了Hadoop调度算法单一的问题和Hadoop对异构平台的兼容性问题。论文最后针对整合后的系统LSH和原生态的Hadoop系统设计了不同的实验,分别来验证两系统对单点故障的处理、差异性作业的性能和异构平台的适应性方面的表现,结果证明LSH系统完全弥补了原生Hadoop的不足,LSH是能够适应企业级的应用。