基于Paxos算法的HDFS高可用性的研究与设计

被引量 : 0次 | 上传用户:yxhzhy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop框架已经成为目前进行大数据量处理的首选框架,甚至被誉为“连接21世界海量数据处理的金钥匙”。HDFS是Hadoop的基础模块,为用户提供了一个分布式的文件系统。然而HDFS的中心服务器Namenode却是单点。由于Namenode服务器的单点失效而造成的整个文件系统的崩溃,已经成为困扰HDFS的棘手问题。针对HDFS中存在的单点故障,目前业界也存在多种HDFS的高可用性方案。它们的核心思想都是采用备机的方式来预防中心服务器的失效。这样的方案虽然可以在HDFS发生单点失效时,用备机为客户提供读服务。然而往往需要人工的干预,及存在数据丢失的可能。因此,需要一个全新的思路来解决HDFS中的单点故障问题。本文设计并实现了基于双中心服务器的HDFS的架构。该HDFS的高可用性方案不但可以有效的解决存在的单点问题,同时也弥补了采用备机思路进行高可用方案的不足。具体而言,本文主要的工作如下:(1)研究当前流行的HDFS基于备机方式的高可用性方案,这些方案也分为热备和冷备,指出了它们共有的不足;研究HDFS的架构,结合中心服务器在HDFS中的地位与作用,提出了基于双中心服务器的HDFS架构;(2)研究分布式一致性算法Paxos,设计出了作用在三机环境下的三机Paxos算法;并且依据该算法设计了数据同步框架Quorum,规范了该框架的读写操作的数据流程;同时指出该框架即使在节点失效的情况下,依然可以对外提供正确的读写访问;(3)研究HDFS的源码实现,深度剖析了HDFS中的代码结构;对HDFS的代码进行修改,让它符合Quorum框架的规范;实现了双中心服务器,将Quorum框架对外提供的保证也移植到HDFS之上;(4)通过对基于双中心服务器的HDFS的测试,验证了该可用性方案的可行性和有效性。本文为HDFS的高可用性提供了新的思路和方法参考,同时本文设计的三机Paxos算法及数据同步框架Quorum也兼有理论和现实意义,具有广泛的的应用价值。
其他文献
加强党小组建设是加强党的组织建设的重要组成部分。在当前市场经济条件下,国有企业加强党小组建设,实现党组织建设与企业各项管理工作相融合,对于提高党员队伍素质,提高基层
缠足是封建社会强加给女性的道德产物,在封建社会里,中国妇女"自愿"忍受缠足之苦,是为满足社会舆论要求。在女权低微的封建社会,女人只能随俗从众,任人摆布。而早在一百多年
由于不同的加载应变路径对板材成形极限有很大的影响,而板材成形极限又将影响到零件冲压工艺方案的制定,为了降低板材零件成形的废品率,尽可能的利用材料的成形性能,本课题针对应
白附片因具有多种生理活性而在中医方剂中被广泛使用,其主要的生理活性成分为其所富含的乌头类生物碱,因此,从白附片中提取分离纯化乌头类生物碱具有较高的经济效益和社会效益。
笔者以其对广西电网500kV、220kV电磁环网开环点的研究,并结合工作中对开环点装设备自投装置的设计体会,对广西电网开环点备自投装置的配置和完善进行了探讨。
覆冰闪络仍然是我国输电线路外绝缘面临的技术难题之一。随电网的迅速发展,跨越高海拔、重覆冰地区的高压输电线路越来越多,电网遭受覆冰闪络的可能性也就越来越大。绝缘子上积
【目的】将动态规划引入河流纳污能力计算,以解决传统算法中水质目标质量浓度难以确定、纳污能力可能出现负值及纳污能力难以达到最大的问题。【方法】在传统纳污能力算法的
民族民间文化在促进地方经济发展所发挥的作用是多方面的。在发展地方经济中,其在招商引资方面的作用也日渐突出。如以民间歌舞为主的秧歌等都可成为招商引资的借助力量,为招
本文主要探讨了秦朝速亡的原因:失"度"导致亡国,强调执政者应以亡秦为鉴,认识"度"的重要性,重视"度"的制约作用,制订方针、政策要从人民群众的根本利益出发,才能确保国泰民安
明清小说常常将戏曲人物、戏曲演出、戏曲谈议等作为本身的有机元素,发挥着重要的文学功能:作为小说的重要动力元素推动故事情节的发展;展现人物的内心活动和人物的性格特征;