论文部分内容阅读
云存储是近些年计算机学科中研究的热门课题。云存储的出现提升了用户随时随地访问文件的便捷性、降低了存储成本、带来了信息存储的新理念。目前云存储的产品已经较为丰富,越来越多的人开始学习和使用云存储服务。
本文主要工作就是在研究云存储架构模型的基础上,借助Hadoop的分布式文件系统(HDFS)来搭建一个云存储平台。Hadoop是Apache的一个软件项目,是对Google文件系统(GFS)和MapReduce的一个开源实现。Hadoop是科研人员研究云计算和云存储的一个很好的参考模型,具有很大的科研价值。Hadoop分布式文件系统HDFS具有强大的分布式文件存储和管理能力。
基于HDFS的模型架构和功能特点,本文工作包括如下两个部分:
首先指出HDFS的架构模型有一个不足的地方,管理文件系统目录空间的NameNode节点存在单点失效问题。针对这个问题,文中给出了一个基于模糊逻辑的NameNode单点失效恢复的优化机制。该机制的创新点在于通过模糊逻辑来预测NameNode的可靠性,基于预测的可靠性来决定是否生成检查点。基于可靠性的检查点可以减少NameNode单点失效恢复的时间。
其次,设计与实现一个基于Hadoop的云存储系统模型。本文针对云存储用户的使用操作和云存储的管理进行了深入研究,设计的云存储系统模型实现了用户的文件上传和下载、系统的设置和运行、存储节点的自动化管理以及系统资源监控等。系统的运行测试验证了设计和实现的云存储系统的有效性。