论文部分内容阅读
自从互联网诞生以来,尤其是网络应用在最近十年的迅猛发展,很多公司的互联网上的业务数据呈现爆炸性增长的态势,这些数据内容涉及了诸多领域,是公司发展必不可少的保证。继互联网热潮之后,数据存储已以成为又一次技术浪潮,网络已进入数据中心时代,数据已经越来越重要,不段增加的用户,越来越多样化的网络服务,迅速发展的多媒体,都使数据处理的难度不段地增大。爆炸性增长的信息资源,对存诸系统的各方面性能提出了越来越高的要求,传统的文件系统满足不了现代应用对高可靠性高可用性易维护性可扩展性高性能以及大容量等要求。
文件系统是常见数据存储的方式,是操作系统在硬盘上存诸,组织和检索数据的方式,硬盘可以是存在于本地的,也可以是存在于网络上的。文件系统总体上分为本地文件系统和分布式文件系统。本地文件系统不需要网络连接即可访问数据,文件系统的数据存放在本地设备上。分布式文件系统管理的存储资源不一定直接在本地设备上,而是通过网络与各个节点相连,它系统中的数据可能来自很多不同只的节点,它管理的数据也有可能存储在网络中不同的节点上。分布式文件系统中的很多设计实现与本地文件系统有很大的差别,分布式文件系统的设计和实现更复杂。
本文就是通过分析对比各种分布式文件系统,吸取各个文件系统的优点,设计出了一个面向海量数据的分布文件体系统。第一章绪论,针对分布式文件件系统的研究现状(包括各种分布式系统的介绍)和研究背景作了详细的介绍,最后给出了本文主要内容。第二章分布式文件系统架构,首先分析了需求并给出了本系统的设计目标,最后出了本文件系的整个架构。第三章元数据系统,先分析元数据系统设计目标,接着给出元数据的分割策略,负载平衡策略以及数据一致性策略。第四章数据副本,介绍了请求的分发策略和副本的放置策略。第五章功能测试,介绍了对文件系统各个模块的测试用例。