论文部分内容阅读
随着数字信息从文本到多媒体的转变以及社会信息化进程的加快,信息量开始呈几何级数爆炸性地增长,海量数据的存储和处理受到社会各界越来越广泛的关注。分布式存储系统(Distributed Storage System)正是一种结合了互联网和存储技术的面向海量数据的存储解决方案。然而,由于网络的不稳定性,分布式存储系统中很容易发生由于节点失效导致的数据无法取回,因此往往需要采取某种冗余机制来提高可靠性。同时,系统需要具有对失效节点所存储的数据进行修复的能力以维持其容错性能,但这一过程可能引起大规模的数据传输。 利用网络编码技术不仅能够提高系统的容错能力,而且能够优化冗余带来的额外存储消耗和数据修复过程的带宽消耗。传统的分布式存储一般采取的是基于纠删码的方法,在一定程度上提高了数据的可靠性,但在数据修复时会产生很大的带宽消耗和计算负载。针对这一问题,本文引出了再生码的概念,并讨论了基于再生码编码策略的三种数据修复模型,通过比较和分析得出了可精确修复的编码方案有更好的实践价值,并分析和总结了现有的精确修复再生码编码方案。 在此基础上,本文提出了一种适用于分布式存储系统的新型准循环再生码编码方案,该编码基于循环结构,是一种不失一般性的再生码构造策略,具有构造简单、运算代价低和修复带宽小等特点。文中详细阐述了其定义和构造方法,并对其构造条件和性质进行了详细的分析和精确的证明。同时,本文针对该编码方案节点修复时的两种限制条件,分别进行了研究和分析:在弱限制条件下,给出了两种节点修复算法,并分别证明了修复带宽的边界(最好情况和最坏情况),同时通过对参数的设置给出了一种准循环MSR码构造方案,不仅存储消耗小而且能够达到修复带宽的最小割下界;在强限制条件下,分析了准循环再生码的扩展性质,并证明了这种限制条件下准循环MSR码的存在性及其存在条件。