论文部分内容阅读
随着信息技术的不断发展、互联网的普及,以及企业和个人对信息技术的广泛应用,极大地促进了数据量的增长,进而导致存储系统规模的不断扩张,对大规模存储系统在容灾能力和存储成本之间的权衡也提出了巨大挑战。但是,现有的存储容灾技术均存在种种不足之处,如:存储空间利用率不高,参数受限,容灾能力较低,或扩展性不强等等,无法满足大规模存储系统的容灾存储需求。 针对上述问题,本文提出利用有限域GF(2)上随机矩阵高概率满秩性质设计存储容灾方案的新思路,通过分析两类随机矩阵(均匀随机和稀疏随机)的相关性质,提出两类存储环境——RAID存储系统和分布式存储系统中基于随机编码技术的容灾存储设计方案。本文的研究成果主要包括以下几个方面: 1、针对现有基于编码思想的存储容灾技术,分析其编译码构造方式,发现其编译码矩阵具有满秩的特点,以及其校验矩阵中任意t(t为容灾能力)行子矩阵均满秩的性质,从而提出通过设计满足上述共性的矩阵来构造相应编译码方案的思路,并利用有限域GF(2)上的随机矩阵进行相关尝试,得到了基于随机编码技术的存储容灾方案。 2、为了满足RAID存储系统对容灾能力和扩展性方面的需求,将随机编码技术应用在RAID存储系统中,并提出分别基于传统磁盘阵列模式、扇区-磁盘模式以及混合编码模式的RAID编码构造方式,以应对不同的RAID存储环境和容灾需求。该随机阵列码(R-RAID)方案较传统阵列码技术具有灵活的参数设置,进而具有更高的容灾能力和扩展性。 3、为了提升大规模分布式存储系统的容灾性能和存储空间利用率,本文将随机编码技术应用到分布式存储系统中,并分别设计了单节点容灾和多节点容灾情况下的编译码方案。该方案较现今的多项式插值方案具有更高的编译码效率,而较现今的通信编码方式,又具有较高的存储空间利用率。 4、针对企业用户对数据安全性的需求,本文进一步提出了安全分布式存储方案(S-SREC),通过将原始数据与冗余数据分离,企业用户自身存储原始数据信息,而将不呈现原始数据信息的冗余数据交付给不可信的第三方存储容灾系统进行容灾,从而一方面避免了原始数据泄露的风险,另一方面,企业用户也可利用冗余数据快速恢复原始数据,实现原始数据的容灾存储。